Pubblicato il 02/06/23 - aggiornato il  | Nessun commento :

Voicemaker è un tool online text-to-speech per convertire testo in audio

Come usare lo strumento online Voicemaker di text-to-speech per convertire testo in audio di sintesi vocale in 120 lingue e scaricarlo in MP3 o OGG

Gli strumenti per convertire un audio parlato in un file di testo si definiscono speech-to-text e abbiamo visto per esempio a tal proposito come usare il servizio Web Speech API di Google. Viceversa i tool per convertire un testo in un audio con la sintesi vocale sono chiamati con l'espressione inglese text-to-speech.

In questo sito abbiamo già recensito diversi strumenti adatti a questa funzionalità. Ricordo tra gli altri l'eccellente Balabolka che utilizza le API della Microsoft, il video editor ClipChamp della stessa azienda, la sintesi vocale di Word e LibreOffice e uno strumento online che converte testo in audio mostrando anche un avatar animato. 

In questo articolo vedremo un altro strumento text-to-speech che nella sua versione gratuita ha più limitazioni di quelli linkati ma che ci permette di convertire testi in audio parlati in tutte le lingue scegliendone anche la voce.

Voicemaker si può usare gratuitamente anche senza registrazione oppure utilizzare un piano a pagamento con funzionalità aggiuntive. Nella sua versione gratuita senza registrazione ci consente solo di convertire fino a 250 caratteri  e questo è laborioso se dovessimo convertire un testo molto lungo perché dovremmo farlo in più volte.

Ho pubblicato sul mio Canale Youtube un tutorial in cui illustro come usare Voicemaker nella versione gratuita.



Dopo aver aperto il sito si può subito andare nel menù in alto su Pricing per visualizzare i prezzi dei vari piani.

Quello Free è valido per sempre ma come detto si possono convertire al massimo 250 caratteri per volta. Si può però scegliere tra 750+ voci diverse che pronunciano le parole in 120+ lingue. Le conversioni effettuate possono anche essere pubblicate su Youtube inserendo però il link di attribuzione al sito. Gli audio così ottenuti potranno essere usati per uso personale e ci sarà comunque un supporto via email accessibile dalla voce Contact del menù.

piani di voicemaker

I piani a pagamento sono quelli Basic, Premium e Business e vanno dai 5$ ai 20$ di costo al mese. Andando su AI Voices nel menù potremo visualizzare e riprodurre tutte le voci disponibili nella libreria di Voicemaker.

Come motore si può scegliere tra AI Engine, Standard TTS e Neural TTS. Le voci del primo motore sono le più umanizzate però sono disponibili solo per gli utenti Premium. Le voci del secondo motore sono le meno valide e saranno disponibili solo fino alla fine dell'anno 2023. È quindi naturale scegliere il motore Neural TTS.

ascolto di voci su voicemaker

In Country si sceglie Italy e in Language si seleziona Italian. Si va poi su Search per visualizzare tutte le voci. Si potranno riprodurre anche quelle delle versioni a pagamento e quindi anche quelle del motore AI Engine.

Per ascoltare una voce si clicca sul Più posto alla destra del nome quindi sul Play per riprodurre il testo mostrato. Le voci utilizzabili gratuitamente per l'italiano sono solo due, una maschile (Tommaso) e una femminile (Viola).

convertire testo in audio

Per la conversione di un testo in un audio occorre prima selezionare il motore quindi la lingua, mettere la spunta alla  voce prescelta e digitare o incollare il testo nell'apposito campo in alto. Si clicca poi su Convert To Speech.

Dopo pochi secondi verrà generato un file che potremo riprodurre andando sulla icona del Play sulla sinistra.

conversione e download audio

Si potrà scaricare il file audio generato andando su uno dei due pulsanti per il download dell'audio. In basso a destra della pagina ci sono anche alcuni interessanti settaggi come quello dell'audio, del volume e della velocità.

La maggiori parte di questi però sono ad esclusivo beneficio degli utenti Premium.

volume velocità e effetti

Gli utenti free possono scaricare il file audio nei formati MP3 o OGG mentre quelli Premium anche nel formato WAV che è lossless. La frequenza di campionamento massima è di 48kHz ma solo per gli utenti Premium mentre quelli gratuiti devono contentarsi di un Sample Rate da 24KHz. Il Volume e la Velocità della pronuncia sono invece modificabili per tutti con un limite di -20dB a +20dB per il volume. Anche gli effetti sono molti tra cui quelli del Respiro, del Sussurro, dell'Empatia, della Calma, ecc... ma sono solo per i Premium.

Dopo aver digitato o incollato il testo si possono aggiungere delle funzionalità come Pausa, Velocità e Volume.

inserire pause nel testo

Dopo aver posizionato il cursore in un punto del testo si potrà aggiungere una pausa da 0,5sec a 6sec. Si può selezionare una porzione di testo e modificarne velocità e/o volume. Infine si può indicare allo strumento di pronunciare del testo come Data, Tempo, Indirizzo, Telefono, ecc. Il problema di queste funzionalità è che aggiungono dei tag al testo che vengono conteggiati come caratteri e quindi ne possono eliminare la parte finale.

Se utilizzate Voicemaker più volte per scaricare più audio allora vi conviene utilizzare una scheda In Incognito o eliminare i cookie del dominio perché dopo qualche conversione vi chiederà di registrarvi per creare un account.



Nessun commento :

Posta un commento

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy