Apple annuncia la possibilità di clonare la voce con l’iPhone. Una novità unica che non manca di aspetti inquietanti.
La possibilità di creare un doppione digitale della nostra voce apre la strada a applicazioni utilissime, soprattutto nel campo delle disabilità. Ma al tempo stesso spalanca anche autostrade a disposizione di chi è mosso da intenti decisamente poco nobili.
Il voice cloning è una tecnica che consente di clonare e riprodurre artificialmente la voce di una persona. Le origini di questa tecnologia risalgono a oltre mezzo secolo fa, al 1970. Il padre del voice cloning è considerato lo studioso giapponese Mashito Mori. In sostanza, questa tecnologia permette di creare una voce sintetica del tutto simile alla nostra.
Anche in questo campo l’avvento dell’intelligenza artificiale ha dato un notevole impulso, potenziando questa tecnologia dalle molteplici applicazioni. L’impatto dell’AI si è rivelato di capitale importanza per il successo delle tecniche di voice cloning.
Tanto che Maximixe Market Research (società specializzata in ricerche di mercato) ha stimato che entro il 2029 il fatturato legato a questa tecnologia aumenterà di circa 2 miliardi di dollari facendo segnare un incremento del 75% rispetto a dieci anni prima. La capitale economica del voice cloning è il Nord America, seguito a ruota da Europa e Asia.
Clonazione della voce: l’ultima novità di Apple
Non stupisce dunque – se ne parlava da tempo – che l’ultima novità in arrivo da Apple riguardi proprio la possibilità di clonare la propria voce attraverso l’iPhone. L’azienda di Cupertino lo ha annunciato nel corso della World Developers Conference (WWDC) 2023 insieme a tutte le novità relative a MacBook Air, Mac Studio, Mac Pro, iOS 17, iPadOS 17, macOS, watchOS 10 e Apple Vision Pro. Oltre ai sistemi operativi e ai dispositivi, Apple ha presentato anche una serie di funzionalità in grado di migliorare l’esperienza dei suoi utenti, tra cui anche la funzione per attivare il voice cloning.
Sarà dunque possibile clonare la propria voce usando l’intelligenza artificiale. La funzione è stata pensata e progettata in maniera da aiutare gli utenti a rischio di perdere la voce a causa di una malattia (ad esempio la SLA, sclerosi laterale amiotrofica) o in previsione di interventi chirurgici delicati che possono compromettere l’uso delle corde vocali.
In pratica potremo usare il melafonino per addestrare l’intelligenza artificiale a replicare in maniera perfetta la nostra voce. I dati biometrici, protetti da crittografia, non saranno conservati sui server di Apple.
Quale funzionalità permetterà di clonare la nostra voce con l’iPhone
Come si chiama la nuova funzionalità che permetterà il voice cloning con l’iPhone? Già lo scorso 18 maggio, in occasione della giornata mondiale sulle disabilità (Global Accessibility Awareness Day), la società californiana aveva anticipato la nuova funzionalità. Un’innovazione in linea col progetto portato avanti da Apple, che col tempo ha costruito una piattaforma che permette alle persone disabili di accedere agli strumenti digitali.
Sarà possibile creare un “gemello digitale” della nostra voce grazie alla funzionalità di accessibilità “Personal Voice”. L’azienda ha annunciato che la novità sarebbe arrivata con l’aggiornamento di iOs 17, l’ultima versione del sistema operativo degli iPhone prevista per settembre e ottobre. Ma “Personal Voice” è già disponibile nella versione beta iniziale di iOs 17 da poco rilasciata, consentendo così agli sviluppatori di testarla fin da subito.
Come clonare la voce su iPhone: passo dopo passo
Per creare un alter ego digitale della propria voce bisognerà registrare un audio di 15 minuti rispondendo a delle frasi casuali.
In questo mondo l’iPhone “imparerà” a riprodurre la nostra voce. Per clonare la propria voce bisognerà seguire una serie di passi.
- Collegare l’account iCloud alla pagina dei beta software di Apple per scaricare la versione beta di iOS 17.
- Iniziare la sessione e accettare le condizioni.
- Scaricare la versione di iOS 17 dalle impostazioni dell’iPhone negli aggiornamenti software.
- Attivare l’opzione degli aggiornamenti beta.
- Una volta completata l’installazione, dovremo accedere alle impostazioni di accessibilità del cellulare per individuare l’opzione “Personal Voice”.
- Successivamente, dovremo creare la nostra “voce personale” seguendo alcuni passaggi.
Sostanzialmente l’iPhone ci chiederà di pronunciare una serie di frasi in maniera tale che il dispositivo possa registrarle. Inoltre, una volta completate le registrazioni vocali, il telefono ci metterà un giorno a sintetizzarle e a unirle insieme per creare una voce in grado di imitare alla perfezione quella dell’utente.
Voice cloning, un campo infinito di possibilità
Come detto la funzionalità per clonare la propria voce è stata pensata da Apple in maniera da favorire l’integrazione delle persone con disabilità. Il campo del voice cloning offre però diverse possibilità di applicazione, non sempre lecite.
Tra le applicazioni lecite del voice cloning ci sono sicuramente quelle legate agli eventi, con la possibilità di creare voci sintetiche che rispondano magari, attraverso appositi totem, alle curiosità e alle domande dei presenti (una possibilità testata durante l’ultima edizione del Palio di Siena).
Altre applicazioni in cui potrebbero essere impiegate le voci sintetiche già battezzate artificial human (o virtual human) riguardano il turismo, la medicina, il cinema (pensiamo alla possibilità di clonare le voci degli attori per usarle durante i doppiaggi o gli spot pubblicitari). Ma è facile prevedere un futuro per le voci sintetiche anche nel campo dell’istruzione e dell’entertainment (corsi di formazione, videogame), oltre che nel settore bancario dove artificial consultant potrebbero presto guidare i clienti all’interno delle piattaforme delle banche.
Le truffe con la voce clonata: un fenomeno in crescita
Ma non è tutto rose e fiori naturalmente. Anche senza lanciarsi in scenari alla P. K. Dick fatti di replicanti vocali che proliferano ovunque non serve una grande fantasia per intuire che accanto alle applicazioni lecite, a cominciare da quelle a beneficio delle disabilità, rischiano di fare la loro comparsa (anzi, l’hanno già fatta) utilizzi decisamente meno nobili delle voci clonate, per non dire inquietanti o francamente criminali.
È il campo delle cosiddette “AI voice cloning scam”: le truffe dell’intelligenza artificiale con clonazione della voce. Si tratta di deepfake della voce con cui i criminali informatici sfruttano la possibilità di clonare la voce con l’intelligenza artificiale per ingannare le loro vittime e convincerle a inviare loro del denaro.
Un sondaggio condotto dal team di McAfee su 7.054 persone di sette Paesi differenti ha mostrato che le truffe legate alle voci clonate con l’intelligenza artificiale sono in aumento. Circa un quarto degli adulti intervistati ha dichiarato di essere stato vittima di una truffa del genere. Il 77% delle vittime ha detto di aver perso del denaro a causa della truffa. Poco meno di un terzo dei partecipanti al sondaggio ha dichiarato di aver perso più di mille dollari e il 7% di averci rimesso una cifra compresa tra i 5 mila e i 15 mila dollari.
L’intelligenza artificiale è in grado di generare una voce praticamente identica a quella originale, usando tool gratuiti o a pagamento che permettono di ottenere una corrispondenza molto alta (pari all’85%) con soli 3 secondi di campione audio. Un’accuratezza che proseguendo con l’”addestramento” può salire fino al 93%.
Come funzionano le truffe coi “deepfake” della voce
Per mettere in atto la loro truffa i cybercriminali devono prima trafugare un campione vocale della loro vittima, cosa possibile accedendo ai contenuti multimediali condivisi sui social o attraverso le app di messaggistica istantanea.
Successivamente i truffatori della rete recuperano i contatti dell’utente con un info-stealer, cioè tramite software malevoli (malware) per rubare le informazioni altrui. Infine mandano un messaggio vocale o telefonano a familiari o amici per chiedere una somma di denaro per coprire qualche presunta urgenza.
A questo riguardo Apple ha assicurato di aver adottato una serie di contromisure per impedire illeciti di questo genere da parte della cybercriminalità della rete. Come prima cosa la voce verrà riconosciuta e sintetizzata soltanto all’interno dell’iPhone o del tablet di Apple tramite il chip Apple Silicon, dotato di una componente (il neural engine) molto potente oltre che specializzata nel machine learning. Telefono o iPad non lasciano alcun dato. Chi vuole sincronizzare la voce clonata con la nuova funzionalità potrà farlo con una funzione attivabile su iCloud, con la garanzia della crittografia end-to-end.