AI per Avatar e Voci Sintetiche: il futuro della comunicazione video

Le voci sintetiche e gli avatar virtuali non sono certo una novità, ma negli ultimi anni la qualità di questi prodotti sta facendo passi da gigante. Grazie all’AI le voci sintetiche stanno diventando realistiche, familiari ed emozionanti e sempre grazie all’AI gli avatar virtuali offrono infinite possibilità estetiche per creare assistenti, testimonial e quant’altro con gli aspetti più disparati e caratteristici.

LE VOCI SINTETICHE: STORIA

La storia della sintesi vocale è estremamente lunga, addirittura antecedente all’invenzione del personal computer. I primi dispositivi elettronici di sintesi vocale basati su computer risalgono approssimativamente al 1950, mentre il primo sistema di text-to-speech fu inventato in Giappone nel 1968. Ma esistevano anche altri sistemi elettronici e meccanici in grado di simulare la voce umana già da tempi ancor più antichi, rendendo la ricerca sulla sintesi vocale un campo quasi centenario. Dai primi esperimenti rudimentali degli anni ’60, la sintesi vocale non ha mai smesso di evolversi. Oggi, grazie all’AI, le voci sintetiche hanno raggiunto un punto in cui non solo possono imitare una voce umana, ma sono in grado di clonare completamente il timbro di una persona reale. Ciò ha aperto le porte a un nuovo fenomeno: il voice cloning e i deepfake vocali.

LE VOCI SINTETICHE: COSA SONO?

Le voci sintetiche sono elementi audio generati da software specifici, concepiti per emulare il parlato umano, conferendo tonalità, accento, espressione ed emozione alle parole, proprio come faremmo noi in una normale conversazione. Escludendo gli assistenti vocali all’interno dei nostri smartphone, vi sarà sicuramente capitato di sentire delle voci sintetiche di tipo TTS (Text to speech) durante l’attesa di un treno in stazione.

Al giorno d’oggi, però, le ricerche più approfondite sul miglioramento del realismo delle voci sintetiche sono eseguite da principalmente quattro aziende, tutte legate ad un qualche tipo di assistente digitale. Abbiamo Amazon con la sua Alexa, Apple con Siri, Google con il suo Assistente e Microsoft con Cortana, tutti alla ricerca di rendere il proprio assistente il più realistico e familiare possibile per i propri utenti.

Le voci sintetiche possono tornare utilissime non solo per gli assistenti vocali, ma anche in moltissimi altri settori. Nel turismo potrebbero essere utilizzate come guide turistiche, così come nei musei. Ma anche nell’istruzione per creare lezioni virtuali, nel commercio, nella sanità, nella comunicazione, ovunque ci sia bisogno di recitare un discorso o una spiegazione, leggere un annuncio o un avviso, grazie all’AI le voci sintetiche possono essere applicate ovunque.

Non solo nel professionale, anche nella musica! Grazie all’AI le voci sintetiche sono diventate sempre più realistiche e hanno persino imparato l’abilità di intonare musicalmente canzoni e frasi, un’evoluzione che fino a qualche anno fa era impensabile. Almeno per gli assistenti vocali. Infatti, in Giappone le voci sintetiche “cantanti” sono un vero e proprio fenomeno grazie a programmi come Vocaloid (2004) e un intero genere musicale basato su cantanti virtuali di cui la star più famosa è Hatsune Miku (2007). Ed è proprio dai vocaloid che ci colleghiamo al prossimo argomento: gli avatar virtuali.

GLI AVATAR VIRTUALI

Anche la storia degli avatar è ormai lunga, con le prime apparizioni di avatar virtuali in televisione attorno alla fine degli anni ’90 o primi anni 2000. Ma all’epoca questi personaggi venivano animati ancora manualmente e la loro qualità era molto bassa, tanto che addirittura a volte potevano mettere a disagio alcuni spettatori. In Giappone gli avatar virtuali sono poi esplosi nuovamente a fine anni 2000 con il fenomeno Vocaloid e anche in occidente, anche se non collegati a voci sintetiche, con artisti musicali come i Gorillaz che utlizzavano dei personaggi animati dei cartoni al posto dei loro veri volti. Ma anche questi avatar venivano animati manualmente, perché l’utilizzo di risorse come il Motion Capture era proibitivamente costoso e di programmi capaci di copiare il movimento umano realisticamente non ce n’erano poi molti.

Un’ulteriore evoluzione degli avatar virtuali, però, avvenne a metà anni 2010 con il fenomeno nuovamente giapponese dei V-Tuber: gli YouTuber virtuali. I V-Tuber erano, e sono, avatar virtuali a tutti gli effetti che copiano le espressioni degli umani che li utilizzano anche se spesso esagerandole in modo cartoonesco. I V-Tuber inoltre fanno spesso uso di voci sintetiche.

Solo negli ultimi anni, però, gli avatar virtuali hanno iniziato ad allontanarsi dall’estetica cartoon per avvicinarsi a un’immagine fotorealistica. Grazie all’AI gli avatar virtuali possono venire generati anche da semplici selfie o brevi video, e le loro capacità espressive sono migliorate in modo esponenziale. Gli avatar virtuali, come la conduttrice televisiva virtuale “Fedha” o la nostra assistente virtuale “Martina”, riescono a copiare quasi perfettamente il labiale del parlato e i piccoli movimenti facciali spesso impercettibili che rendono realistico un volto.

Con la nascita degli influencer virtuali anche in occidente, nonostante l’oriente rimanga sempre un passo avanti per quanto riguarda la popolarità di queste tendenze, siamo giunti in un’epoca in cui gli avatar virtuali sono ormai persone a tutti gli effetti in grado di sponsorizzare prodotti ed influenzare le scelte di milioni di persone, trasmettere messaggi alle masse e addirittura ispirare il prossimo, grazie alla simpatia e al senso di familiarità e fiducia che riescono a creare. Gli avatar virtuali sono espressivi ed emotivi, e possono essere impiegati in moltissimi settori specialmente quando combinati a voci sintetiche e TTS.

VUOI APPROFONDIRE L’UTILIZZO DELL’INTELLIGENZA ARTIFICIALE PER LE VOCI SINTETICHE E GLI AVATAR VIRUTALI NEL MARKETING?

Se sei un professionista che vuole rimanere sempre sulla cresta dell’onda delle nuove tecnologie digitali e rendere il proprio business innovativo e differente, non perdere l’evento MM ONE Academy – Avatar e Voci Sintetiche il prossimo 22 giugno nella nostra sede. Non puoi venire? Non preoccuparti, l’evento sarà anche disponibile in differita su MM ONE TV!

Durante l’incontro parleremo del futuro dell’AI per le voci sintetiche e per gli avatar virtuali e di come potrai applicarle nella strategia marketing della tua azienda in modo efficace.

Non perdere quest’occasione unica per far crescere la tua competitività nell’era digitale!

 loading=

Vuoi prenotare un appuntamento?

Fissalo in base alle tue esigenze, Andreas è a tua disposizione!

Il tuo percorso comincia contattandoci

Inviaci un messaggio scrivendoci i tuoi obiettivi.