Pubblicato il 10/05/21 - aggiornato il  | Nessun commento :

Convertire testo in audio con tool online anche con il video di un avatar

Convertire testo in audio online con sintesi vocale che supporta 30 lingue e 180 tipi di voci e che mostra un avatar con il labiale sincronizzato

Recentemente abbiamo visto come utilizzare il Traduttore di Google per convertire testo in file audio, anche con l'aiuto del sintetizzatore vocale di Windows 10. Questa funzionalità pare che adesso non sia più disponibile o almeno che sia meno accessibile di qualche tempo fa. In questo post vedremo come fare lo stesso con un tool online.

Si tratta di una funzionalità gratuita mostrata come demo di un progetto più ambizioso di Text-to-Speech. Lo strumento che mi accingo a recensire supporta diverse lingue, tra cui l'italiano, e ci consente di scegliere tra diversi tipi di voci. Oltre alle voci maschili e femminili, sono disponibili voci di bambini e pure voci decisamente insolite.

Un'altra interessante caratteristica di questo strumento è quella di mostrare un avatar che muove le labbra in modo sincrono con le parole che vengono pronunciate dalla voce sintetica. Le voci particolari di giganti, marziani, anziani, nerd, ecc... sono però disponibili solo per la lingua inglese. Non c'è un sistema diretto per scaricare il file generato dalla conversione del testo ma si può risolvere registrando la voce sintetica con programmi come Audacity.

Visto che, contestualmente alla riproduzione dell'audio, viene mostrato anche un avatar con i movimenti delle labbra sincronizzati con le parole pronunciate, si può anche registrare un video con uno dei tanti programmi adibiti a questo scopo. Poi eventualmente il video potrà essere convertito in solo audio MP3 o altro formato.

Ho pubblicato sul mio Canale Youtube un video che illustra come utilizzare questo tool online text-to-speech.



Lo strumento in oggetto è OddCast Text-to-Speech Demo che fa parte del progetto più generale della Oddcast Media Technology. La sintesi vocale consente ai personaggi di pronunciare il testo in modo dinamico, in tempo reale e con una accurata sincronizzazione labiale. All'audio possono anche essere applicati effetti speciali.

Sono supportate 30 lingue diverse con voci maschili e femminili per un totale di 185 opzioni tra cui scegliere. C'è però il limite massimo di 600 caratteri che possono essere incollati nel campo apposito.

oddcast text-to-speech

Dopo aver aperto la pagina del tool online, si seleziona la lingua del testo da convertire in audio. Le lingue supportate sono: arabo, basco, catalano, cinese, ceco, danese, olandese, inglese, esperanto, filippino, finlandese, francese, galiziano, tedesco, greco, hindi, ungherese, indonesiano, italiano, giapponese, coreano, norvegese, polacco, portoghese, russo, slovacco, rumeno, spagnolo, svedese, tailandese, turco e ucraino.

Il passaggio successivo è quello di scegliere la tipologia della voce sintetica tra adulti, bambini e voci insolite. Quest'ultima tipologia può essere attivata solo per testi in lingua inglese. Il terzo passaggio ci permette di scegliere la voce preferita. Tra le voci di adulti ci sono voci maschili e femminili. Per l'italiano si sceglie tra Paola, Alessandro, Bianca, Federica, Elisa, Giulia, Luca, Marcello, Matteo, Paolo, Raffaele, Roberto, Silvana, Silvia e Valentina.

Di default è impostato Nessuno (None) come effetto ma si possono aggiungere alla voce sintetica gli effetti Pitch (tonalità), Speed (velocità), Duration (durata), Echo (eco), Reverber (riverbero), Flanger (variazione ciclica di fase), Phase (fase), Bullhorn (megafono), Whisper (sussurro).

Dopo aver scelto le impostazioni, si digita, o si incolla, il testo nell'apposito campo, posto nella colonna di sinistra. Come già detto il numero massimo di caratteri consentito è di 600 e questo è un limite piuttosto severo.

riproduzione audio del testo digitato

In alto a sinistra ci sono due pulsanti. Quello del dado serve per cambiare in modo casuale l'avatar che ci viene proposto mentre, con il pulsante del punto interrogativo, si apre una finestra popup in cui ci sono i link per installare le versioni trial di 15 giorni della app per il Text-to-Speech e della app per gli avatar parlanti.

Si clicca sul pulsante Say it sotto al campo del testo digitato per ascoltarne la sintesi vocale. La si può interrompere cliccando sul pulsante di Stop, visualizzato al posto di quello del Say it. Passando con il cursore sulla riproduzione audio video verrà mostrato il classico pulsante per mettere in pausa che, se cliccato, cambierà in quello del Play.

Si tratta di uno streaming audio video che può essere registrato in vari modi. Se ci interessa il solo audio, si può usare il registratore vocale di Windows 10, digitando la scritta colorata di blu dopo aver cliccato su Start, oppure il già citato e linkato programma Audacity, o ancora il programma gratuito Ashampoo Audio Recorder Free.

Si può anche decidere di registrare l'area dell'avatar come video con audio. Lo si può fare con programmi commerciali come Camtasia o Snagit ma anche con software gratuiti come OBS o CamStudio. Un'altra possibilità è quella di usare il tool online Screencast-o-Matic che è gratuito e che offre molte personalizzazioni.




Nessun commento :

Posta un commento

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy