Pubblicato il 31/01/25 - aggiornato il  | Nessun commento :

Qwen è una app per la AI di Alibaba per creare app, immagini e video

DeepSeek non è l'unica app cinese sviluppata per interagire con l'intelligenza artificiale. La multinazionale Alibaba, conosciuta soprattutto come fornitissimo negozio online, ha rilasciato anche la sua app per la AI.

È anche più avanti di DeepSeek perché in una sola schermata può rispondere a domande testuali, creare immagini e analizzare documenti. In futuro potrà creare anche video. Il progetto in questione si chiama Qwen ed è stato condiviso su GitHub. Nel blog di Qwen, sempre su GitHub, è stato presentato l'ultimo modello Qwen2.5 VL.



Pubblicato il 29/01/25 - aggiornato il  | Nessun commento :

Janus-Pro di DeepSeek per creare immagini da descrizioni testuali

DeepSeek non ha solo creato un modello adatto a rispondere alle domande degli utenti ma ha pure rilasciato un tool per creare immagini da una descrizione. Lo strumento in oggetto si chiama Janus ed è condiviso su GitHub

Janus-PRO è una versione aggiornata di Janus con una superiore capacità di seguire le istruzioni da testo a immagine migliorandone al contempo la stabilità. I modelli di Janus sono tutti caricati su Hugging Face a disposizione di chi li voglia testare gratuitamente. I modelli finora rilasciati sono Janus-1.3B, JanusFlow 1.3B, Janus-Pro-1B e il più recente Janus-Pro-7b. Nella pagina appena linkata si possono leggere le caratteristiche di questo modello. Invece per utilizzarlo si apre la sezione Spaces in cui ci sono diverse app che lo usano.



Pubblicato il 28/01/25 - aggiornato il  | Nessun commento :

DeepSeek app AI open source da scheda del browser e da app per mobile

DeepSeek è un'azienda cinese specializzata in intelligenza artificiale che usa un modello di linguaggio sviluppato dal loro stesso team. Il modello deriva dall'addestramento su enormi quantità di dati testuali (libri, articoli, conversazioni, ecc.), usando architetture avanzate basate sui trasformer, simili a quelle di GPT. Tuttavia, i dettagli specifici del training (come dataset esatti o parametri) non sono pubblici. La base è un modello proprietario di DeepSeek, ottimizzato per bilanciare prestazioni e efficienza. Pur condividendo principi con modelli come GPT o Llama (es. meccanismi di attenzione), l'architettura esatta del modello non è open source. La versione attuale si concentra su risposte concise, accuratezza e adattabilità a contesti multilingue, incluso quello della lingua italiana.

DeepSeek ha rilasciato alcune versioni open source di modelli precedenti per trasparenza, collaborazione e accessibilità. La scorsa settimana l'applicazione DeepSeek per iPhone è stata la più scaricata dall'App Store.



Pubblicato il 27/01/25 - aggiornato il  | Nessun commento :

Come creare immagini gratis da desktop e da mobile con la AI di Recraft

Ai già numerosi strumenti online che ci permettono di creare immagini a partire da un prompt testuale, se ne aggiungono sempre di nuovi. È consigliabile mettere tra i Preferiti del browser tutti questi tool per poi scegliere quello più adatto sul momento e anche quello disponibile perché soggetti a delle limitazioni per gli account free.

Tra gli strumenti basati sulla AI con cui creare immagini, ricordo Microsoft Designer, Adobe Firefly, Ideogram, Leonardo.ai, Kling AI e Flux che sono quelli che utilizzo più spesso. Nel mio browser predefinito adesso ho salvato anche il tool Recraft che offre molte opzioni gratuite con risultati veramente molto buoni.



Pubblicato il 24/01/25 - aggiornato il  | Nessun commento :

Come aumentare o diminuire volume di voce e strumenti in una canzone

La multinazionale Intel che produce semiconduttori e microprocessori ha rilasciato un progetto open source denominato OpenVINO, basato sulla intelligenza artificiale, per sviluppare dei modelli di apprendimento.

Questo progetto è stato implementato in un plugin per il programma Audacity che può essere scaricato da GitHub. Si clicca sul link per scaricare il plugin sotto forma di file .exe. Tale plugin va installato nella stessa cartella in cui è installato Audacity e deve essere compatibile con quella versione. Nel momento in cui scrivo questo post la versione più recente di Audacity è la 3.7.1, la stessa del plugin OpenVINO. Per installare o per aggiornare Audacity cliccate sul link Download without Muse Hub, se non volete installare il Muse Hub, comunque gratuito.



Pubblicato il 23/01/25 - aggiornato il  | Nessun commento :

Rimuovere oggetti e persone con la Gomma Magica di Google Foto

Google Foto è un servizio che può essere utilizzato da desktop e da app per il mobile. Da desktop si apre in una scheda del browser mentre da mobile occorre installare le rispettive applicazioni dal Play Store e dall'App Store.

Oltre a funzionare come archivio di immagini, con Google Foto si possono anche editare. Gli strumenti presenti nella versione desktop sono però meno interessanti rispetto a quelli della versione mobile. In questo post vedremo come usare la Gomma Magica per rimuovere oggetti e persone indesiderati dalle immagini con la AI di Google.



Pubblicato il 22/01/25 - aggiornato il  | Nessun commento :

Come usare mouse e tastiere wireless con smartphone e tablet Android

La tecnologia OTG, acronimo di On-The-Go, è una tecnologia che ha quasi 20 anni e che permette ai dispositivi che si connettono con porte USB, come tablet e smartphone, di funzionare come un host, consentendo la connessione ad altri dispositivi OTG come fotocamere, mouse e tastiere. In questo post vedremo come utilizzare questa tecnologia applicata a mouse e a tastiere wireless per collegarli a dispositivi mobili.

Negli ultimi modelli di smartphone la tecnologia OTG non è neppure più menzionata perché diventata ormai uno standard. Nei modelli più vecchi è opportuno andare sulle Impostazioni e cercare OTG per poi abilitarlo.



Pubblicato il 21/01/25 - aggiornato il  | Nessun commento :

Come leggere i cartoon in formato CBR e CBZ da PC, da Android e da iOS

Se nel vostro computer, o dispositivo mobile, avete scaricato, o vi hanno inviato dei file, in formato CBR, CBZ e CB7 significa che probabilmente siete appassionati di fumetti o di cartoon o di manga o di comics che dir si voglia. Si tratta infatti di formati supportati dai lettori di fumetti che aprono i file e mostrano le strisce delle immagini che vi sono contenute. Infatti i file CBR e CBZ sono formati comunemente utilizzati per la distribuzione e la lettura di fumetti digitali. I file CBR, CBZ, CB7 sono assimilabili ai classici file di archivio come ZIP e RAR. Altre estensioni di file tipiche per la visualizzazione di fumetti sono CBT e CBA che però sono molto meno comuni.

CBR e CBZ sono gli acronimi rispettivamente di Comic Book RAR e di Comic Book ZIP e contengono immagini in sequenza (come file JPEG o PNG) che rappresentano le pagine di un fumetto. I CBR sono archivi compressi con l'algoritmo RAR mentre i CBZ sono immagini compresse con l'algoritmo dei file ZIP.



Pubblicato il 20/01/25 - aggiornato il  | Nessun commento :

Creare testi animati e salvarli con lo sfondo trasparente con Shotcut

Shotcut è il video editor più utilizzato dai non professionisti per la creazione di progetti, che però non saranno solo dilettanteschi ma potranno avere anche una dimensione più professionale, come quella necessaria per la condivisione su Youtube o su altri social. Mi sono occupato spesso di Shotcut e ho creato una Playlist di tutorial.

Si tratta di una collezione di quasi 300 video a cui ne aggiungerò un altro proprio oggi. Mostrerò infatti come creare un testo animato personalizzabile nei colori, nel font, nelle dimensioni, da salvare come video con uno sfondo trasparente in un formato che supporti il Canale Alfa in modo da poter essere sovrimpresso ad altri progetti video.



Pubblicato il 19/01/25 - aggiornato il  | Nessun commento :

Personalizzare la miniatura dei video su Windows scegliendo il frame

Su Esplora File di Windows, andando su Visualizza, possiamo scegliere se visualizzare i dettagli dei file o se vederne le icone. Questo è utile nel caso di immagini e di video per individuare i file senza leggerne il nome.

Se optiamo per le icone, ci sono quattro visualizzazioni: icone piccole, medie, grandi e molto grandi. La miniatura delle immagini è costituita dall'immagine stessa rimpicciolita ma, per le icone dei video, Windows sceglie arbitrariamente un fotogramma, solitamente il primo o comunque nella prima parte del filmato.



Pubblicato il 17/01/25 - aggiornato il  | Nessun commento :

Come oscurare volti e oggetti nei video tracciandoli con Shotcut

Nascondere o censurare una o più facce in un video, prima di pubblicarlo, è una operazione necessaria quando i protagonisti del video sono minorenni, quando non si vuol far riconoscere una persona, quando non abbiano l'autorizzazione di un soggetto presente nel filmato riguardo alla sua pubblicazione e anche in molti altri casi.

Altre cose che è necessario oscurare nei video sono le targhe e altri riferimenti di dati sensibili. Con Shotcut si possono nascondere volti e oggetti in movimento nei video tracciando i loro spostamenti con un apposito filtro.



Pubblicato il 16/01/25 - aggiornato il  | Nessun commento :

Estrarre testo dalle immagini su Windows con OCR senza programmi

Il Riconoscimento Ottico dei Caratteri (OCR), dall'inglese Optical Character Recognition, è una tecnologia che consente di convertire immagini contenenti testo in dati digitali modificabili. Questa tecnologia è utilizzata per estrarre informazioni da documenti cartacei, fotografie e file PDF, trasformando il testo non modificabile in un formato leggibile da computer. Il funzionamento dell'OCR si articola in diverse fasi fondamentali:

  1. Acquisizione dell'immagine: Il processo inizia con la scansione del documento tramite uno scanner o una fotocamera digitale, creando un'immagine digitale del testo.
  2. Pre-elaborazione: L'immagine acquisita viene pulita e preparata per l'analisi. Questo può includere la rimozione di rumore, la correzione dell'orientamento e la normalizzazione del contrasto.
  3. Segmentazione: L'immagine viene suddivisa in aree contenenti testo, parole e caratteri. Questa fase è cruciale per facilitare il riconoscimento dei singoli caratteri.
  4. Estrazione delle caratteristiche: I caratteri segmentati vengono analizzati per identificare le loro caratteristiche distintive, come forma e dimensione. Queste informazioni vengono confrontate con un database di caratteri noti.
  5. Riconoscimento dei caratteri: Utilizzando algoritmi di machine learning o reti neurali, il sistema confronta le caratteristiche estratte con quelle memorizzate nel database per determinare quali caratteri sono presenti nell'immagine.
  6. Ricostruzione del testo: Dopo aver identificato i caratteri, il sistema ricompone le parole e le frasi, restituendo il testo in un formato digitale modificabile.



Pubblicato il 14/01/25 - aggiornato il  | Nessun commento :

Come convertire testo di tutte le lingue in audio con ClipChamp

Il text-to-speech, o TTS, o sintesi vocale, è una tecnologia che converte il testo scritto in parlato. In poche parole, è come avere un computer che legge ad alta voce un documento. Come funziona?

Il processo di conversione del testo in parlato coinvolge diversi passaggi:

  1. Analisi del testo: Il testo viene scomposto in parole, frasi e paragrafi. Vengono identificati i segni di punteggiatura, le maiuscole e le minuscole, e vengono analizzate le regole grammaticali.
  2. Conversione in suoni: Ogni parola viene associata a un insieme di suoni elementari (fonemi). Il computer utilizza un dizionario e regole di pronuncia per determinare come questi suoni devono essere combinati.
  3. Generazione dell'audio: I suoni vengono poi assemblati per formare le parole e le frasi. Vengono aggiunti anche gli aspetti prosodici, come l'intonazione, l'accento e il ritmo, per rendere il parlato più naturale.
  4. Produzione dell'audio: L'audio generato viene infine convertito in un formato digitale, come MP3 o WAV, che può essere riprodotto su qualsiasi dispositivo audio. A cosa serve il text-to-speech?


Pubblicato il 13/01/25 - aggiornato il  | Nessun commento :

Come attivare la trascrizione delle note vocali su WhatsApp

Se si riceve una nota vocale su WhatsApp in un momento in cui non siamo soli, e non abbiamo le cuffie dello smartphone, può essere imbarazzante riprodurla e farla ascoltare a tutti quelli che sono nelle vicinanze.

Per questa ragione WhatsApp ha introdotto la trascrizione dei messaggi vocali, per il momento questa funzione è arrivata nella versione Beta di WhatsApp e supporta solo quattro lingue. Sicuramente con il prossimo aggiornamento arriverà anche nella versione stabile e si spera che a breve supporti anche la lingua italiana.

 



Pubblicato il 12/01/25 - aggiornato il  | Nessun commento :

Forzare la AI di ChatGPT, Perplexity e Gemini a fornire risultati di qualità

Utilizzare l'intelligenza artificiale per raccogliere dati può farci risparmiare una notevole quantità di tempo. Tuttavia, l'accuratezza e l'affidabilità dei risultati dipendono fortemente dalla qualità delle informazioni utilizzate dal modello.

Con un po' di attenzione si possono però usare alcune strategie per forzare i modelli di intelligenza artificiale a fornire risposte basate solo su sorgenti di alta qualità. I modelli di ChatGPT, Perplexity e Gemini sono addestrati su un'enorme quantità di testo e di codice. Questo significa che hanno già una vasta conoscenza di fatti, concetti e informazioni generali. Quando ricevono una domanda, cercano prima di tutto una risposta all'interno di questa base di dati. Se però non trovano una risposta sufficientemente completa o precisa nei suoi dati esistenti, possono eseguire ricerche attive sul web per trovare informazioni più aggiornate e pertinenti. Questo permette loro di fornire risposte più accurate e complete, soprattutto su argomenti di strettissima attualità. In sostanza questi modelli usano una combinazione di strategie per dare risposte a domande di ogni genere con precisione, completezza e flessibilità.



Pubblicato il 10/01/25 - aggiornato il  | Nessun commento :

Come cambiare l'audio di un video e come parlarci sopra con ClipChamp

ClipChamp è da diverso tempo diventato il video editor ufficiale della Microsoft che l'ha acquistato proprio per questo. Ha una vasta libreria di effetti e animazioni ma ha il difetto di non avere la funzionalità dei Fotogrammi Chiave. Questo strumento si può fruire da browser desktop e da applicazione installata dal Microsoft Store.

Come già accennato ClipChamp si può usare da scheda del browser cliccando sul link precedente o, alternativamente, anche come app installata dal Microsoft Store o come Progressive Web App aggiunta come collegamento nel desktop del computer. Dopo il login su ClipChamp si va su Crea un nuovo video.



Pubblicato il 09/01/25 - aggiornato il  | Nessun commento :

Creare video di baci con la AI caricando le foto di due persone

Recentemente abbiamo visto come con lo strumento AI Hug si possano creare video di persone che si abbracciano a partire da delle loro foto. Con lo stesso strumento in questo post vedremo come creare video di baci tra due persone.

Di quest'ultime dovremo solo caricare le immagini. Come già scritto nel precedente articolo, visto che gli sfondi delle due foto sono generalmente diversi, è meglio eliminarli e sostituirli con uno sfondo verde con lo stesso codice Hex.



Pubblicato il 08/01/25 - aggiornato il  | Nessun commento :

Come pubblicare e ascoltare i video su Youtube doppiati in automatico

Il doppiaggio automatico per i video di Youtube genera tracce audio tradotte in diverse lingue per rendere i video dei creators più accessibili agli spettatori di tutto il mondo. Questa funzionalità viene costantemente estesa a partire dal Dicembre 2023, quindi da più di un anno. Il doppiaggio automatico è già disponibile per molti creators di lingua inglese e il suo rilascio continuerà per tutto il 2024 in modo da raggiungere un pubblico sempre più vasto.

La lingua di elezione è naturalmente l'Inglese (USA) ma già vengono supportate le lingue seguenti: Francese, Tedesco, Italiano, Portoghese e Spagnolo. Mentre sono in fase ancora sperimentale l'Hindi, l'Indonesiano e il Giapponese. Questa funzionalità diventerà attiva per impostazione predefinita. Quando il creator carica un nuovo video, vengono generate automaticamente delle versioni doppiate, che verranno pubblicate automaticamente.



Pubblicato il 07/01/25 - aggiornato il  | Nessun commento :

Creare video di abbracci con la AI caricando foto di due persone

In un precedente post ho mostrato come creare video di baci e abbracci tra persone famose creando preventivamente le immagini con l'intelligenza artificiale di Grok su X. In un commento mi è stato chiesto se fosse possibile creare video di abbracci tra persone non famose e non conosciute dai modelli di intelligenza artificiale.

Questo lo si può fare utilizzando uno strumento online che per i primi video può essere usato anche gratuitamente. Si caricano due immagini di persone e lo strumento creerà un video in cui le due persone presenti nelle foto si abbracciano per 5 secondi. Gli sfondi delle due immagini rimarranno nel video creando un effetto buffo.



Pubblicato il 06/01/25 - aggiornato il  | Nessun commento :

Chiavetta USB per trasferire file da Android a computer e viceversa

Recentemente sono state aggiunte almeno due interessanti funzionalità per trasferire file da dispositivi mobili Android a computer Windows e viceversa. Google ha reso disponibile per i dispositivi Android 6 o superiore la funzione Quick Share con cui inviare file e cartelle da smartphone a computer e da computer a smartphone.

La funzionalità però più sorprendente è quella che permette agli utenti di Windows di navigare file e cartelle di Android direttamente da Esplora File dove il dispositivo Android è equiparato a un'unità del computer.



Pubblicato il 04/01/25 - aggiornato il  | Nessun commento :

Come risolvere se è impossibile inizializzare la GPU su DaVinci Resolve

Un'unità di elaborazione grafica (GPU), acronimo di Graphics Processing Unit, è un circuito elettronico progettato per accelerare l'elaborazione grafica e il rendering delle immagini. Le GPU sono fondamentali per gestire compiti che richiedono un elevato carico computazionale, come il rendering di videogiochi, l'editing video e le applicazioni di machine learning. Le GPU operano eseguendo calcoli matematici in parallelo, il che significa che possono elaborare molteplici operazioni contemporaneamente. Questo approccio consente una maggiore efficienza rispetto alle unità di elaborazione centrale (CPU), che tendono a gestire i compiti in modo sequenziale. Le GPU sono dotate di migliaia di core, permettendo loro di eseguire operazioni su grandi set di dati in modo efficace.

La GPU più conosciuta e utilizzata attualmente è la NVIDIA GeForce RTX 4090. Il mio computer comincia a sentire il peso degli anni e la sua GPU è ormai obsoleta essendo la NVIDIA GeForce GTX 1050. D'altra parte i programmi desktop del computer, aumentando le loro funzionalità, hanno bisogno di GPU sempre più performanti.



Pubblicato il 03/01/25 - aggiornato il  | Nessun commento :

Quick Share di Google per inviare file da Android a PC e viceversa

Google ha aggiornato la funzionalità della Condivisione nelle Vicinanze, o Nearby Share, per il trasferimento di file da computer Windows a dispositivi mobili Android e viceversa. Ha fatto propria l'esperienza di Samsung che nei suoi dispositivi aveva una funzione molto simile. Adesso le due applicazioni si sono fuse in una soltanto.

Il nome è lo stesso di quella di Samsung, ovvero Quick Share, ma, contrariamente a quella sviluppata dalla casa coreana, funziona su tutti i dispositivi mobili Android. In questo post vedremo come usare questo strumento per trasferire file e cartelle da computer Windows a smartphone e tablet Android e viceversa. I computer Windows supportati sono quelli a 64-bit con OS Windows 10 o successivi mentre i computer ARM non sono supportati.



Pubblicato il 02/01/25 - aggiornato il  | Nessun commento :

Disegnare e aggiungere grafica animata nei video con DaVinci Resolve

DaVinci Resolve è un eccellente video editor con una versione gratuita (Lite) e una a pagamento, denominata DaVinci Resolve Studio. Entrambi i software sono arrivati alla versione 19 e anche il programma gratuito ha delle funzionalità veramente notevoli, paragonabili a quelle dei software più prestigiosi come Adobe Première.

Si va nella Home di DaVinci Resolve e si clicca su  Download gratuito. Nella finestra si può scegliere tra il programma gratuito, a sinistra, e quell0 a pagamento, sulla destra. Ciascuno di essi ha 4 pulsanti, rispettivamente per Windows x86, Windows ARM, MacOSX e Linux. Dopo aver cliccato sul pulsante per ottenere la versione gratuita per il nostro sistema operativo, dovremo compilare un modulo con alcuni dati quali nome, email, paese.