I computer stanno diventando sempre più bravi a simulare la realtà. Il cinema moderno, per esempio, si basa molto su set, scenari e personaggi generati dal computer al posto dei luoghi pratici e degli oggetti di scena che erano comuni una volta, e la maggior parte delle volte queste scene sono in gran parte indistinguibili dalla realtà. Recentemente, la tecnologia deepfake ha fatto notizia. L’ultima iterazione nelle immagini computerizzate, i deepfake sono creati quando l’intelligenza artificiale (AI) è programmata per sostituire le sembianze di una persona con un’altra in un video registrato.
Cos’è un deepfake e come funziona?
Il termine “deepfake” (qui la definizione su wikipedia) deriva dalla tecnologia sottostante “deep learning”, che è una forma di IA. Gli algoritmi di deep learning, che imparano da soli a risolvere i problemi quando vengono dati grandi insiemi di dati, vengono utilizzati per scambiare i volti nei video e nei contenuti digitali per creare dei fake media dall’aspetto realistico.
Secondo Wikipedia, la parola Deepfake è nata nel 2017 da un utente di Reddit chiamato “deepfakes”. Detto questo, nessun uomo può rivendicare l’invenzione di Deepfake. Il lavoro fatto in computer vision, IA e ML ha reso fattibile per i ricercatori e le armature di creare deepfake. Non c’è una singola persona che ha inventato tutto questo.
Ci sono diversi metodi per creare deepfakes, ma il più comune si basa sull’uso di reti neurali profonde che coinvolgono autocodificatori che impiegano una tecnica di face-swapping. È necessario innanzitutto un video di destinazione da utilizzare come base del deepfake e poi una raccolta di video clip della persona che si desidera inserire nel target.
I video possono essere completamente estranei; il target potrebbe essere una clip di un film di Hollywood, per esempio, e i video della persona che si vuole inserire nel film potrebbero essere clip casuali scaricati da YouTube.
L’autoencoder è un programma di deep learning AI incaricato di studiare i video clip per capire come appare la persona da una varietà di angolazioni e condizioni ambientali, e poi mappare quella persona sull’individuo nel video di destinazione trovando caratteristiche comuni.
Un altro tipo di apprendimento automatico viene aggiunto al mix, noto come Generative Adversarial Networks (GANs), che rileva e migliora qualsiasi difetto nel deepfake in più turni, rendendo più difficile per i rilevatori di deepfake decodificarli.
Le GAN sono anche utilizzate come un metodo popolare per la creazione di deepfake, basandosi sullo studio di grandi quantità di dati per “imparare” a sviluppare nuovi esempi che imitano la cosa reale, con risultati dolorosamente accurati.
Diverse app e software rendono la generazione di deepfake facile anche per i principianti, come l’app cinese Zao, DeepFace Lab, FaceApp (che è un’app di fotoritocco con tecniche AI incorporate), Face Swap, e la ormai rimossa DeepNude, un’app particolarmente pericolosa che generava false immagini di nudo femminile.
Una grande quantità di software deepfake può essere trovata su GitHub, una comunità di sviluppo software open source. Alcune di queste applicazioni sono utilizzate per puro scopo di intrattenimento – motivo per cui la creazione di deepfake non è fuorilegge – mentre altre hanno molte più probabilità di essere utilizzate in modo malevolo.
Molti esperti ritengono che, in futuro, i deepfake diventeranno molto più sofisticati con l’ulteriore sviluppo della tecnologia e potrebbero introdurre minacce più gravi per il pubblico, relative a interferenze elettorali, tensioni politiche e ulteriori attività criminali.
I deepfakes sono solo video?
I deepfakes non si limitano solo ai video. Il deepfake audio è un campo in rapida crescita che ha un enorme numero di applicazioni.
I deepfake audio realistici possono ora essere fatti usando algoritmi di deep learning con solo poche ore (o in alcuni casi, minuti) di audio della persona la cui voce viene clonata, e una volta che un modello di voce è fatto, quella persona può essere fatta per dire qualsiasi cosa, come quando l’audio falso di un CEO è stato usato per commettere una frode l’anno scorso.
L’audio deepfake ha applicazioni mediche sotto forma di sostituzione della voce, così come nella progettazione di giochi per computer – ora i programmatori possono permettere ai personaggi in-gamer di dire qualsiasi cosa in tempo reale piuttosto che basarsi su un set limitato di script che sono stati registrati prima che il gioco fosse pubblicato.
Come vengono usati i deepfake?
Mentre la capacità di scambiare automaticamente i volti per creare video sintetici credibili e dall’aspetto realistico ha alcune interessanti applicazioni benigne (come nel cinema e nei giochi), questa è ovviamente una tecnologia pericolosa con alcune applicazioni preoccupanti. Una delle prime applicazioni del mondo reale per i deepfake è stata, infatti, per creare pornografia sintetica.
Nel 2017, un utente di reddit chiamato “deepfakes” ha creato un forum per il porno che presentava attori con la faccia scambiata. Da quel momento, il porno (in particolare il revenge porn) ha fatto ripetutamente notizia, danneggiando gravemente la reputazione di celebrità e personaggi di spicco. Secondo un rapporto di Deeptrace, la pornografia ha costituito il 96% dei video deepfake trovati online nel 2019.
I video deepfake sono stati utilizzati anche in politica. Nel 2018, ad esempio, un partito politico belga ha pubblicato un video di Donald Trump che teneva un discorso in cui chiedeva al Belgio di ritirarsi dall’accordo sul clima di Parigi. Trump non ha mai tenuto quel discorso, tuttavia – era un deepfake. Questo non è stato il primo uso di un deepfake per creare video fuorvianti, e gli esperti politici esperti di tecnologia si stanno preparando per una futura ondata di fake news che presentano deepfake convincenti e realistici.
Come individuare un deepfake
Man mano che i deepfake diventano più comuni, la società collettivamente dovrà molto probabilmente adattarsi a individuare i video deepfake nello stesso modo in cui gli utenti online sono ora in sintonia con l’individuazione di altri tipi di fake news.
Spesso, come nel caso della cybersicurezza, deve emergere più tecnologia deepfake per rilevare e prevenire la sua diffusione, che può a sua volta innescare un circolo vizioso e creare potenzialmente più danni.
- Gli attuali deepfakes hanno difficoltà ad animare realisticamente i volti, e il risultato sono video in cui il soggetto non batte mai le palpebre, o le batte troppo spesso o in modo innaturale. Tuttavia, dopo che i ricercatori dell’Università di Albany hanno pubblicato uno studio che rileva l’anomalia dell’ammiccamento, sono stati rilasciati nuovi deepfake che non hanno più questo problema.
- Cerca problemi con la pelle o i capelli, o volti che sembrano essere più sfocati dell’ambiente in cui sono posizionati. La messa a fuoco potrebbe sembrare innaturalmente morbida.
- L’illuminazione sembra innaturale? Spesso, gli algoritmi di deepfake manterranno l’illuminazione delle clip che sono state utilizzate come modelli per il video falso, che è una scarsa corrispondenza con l’illuminazione nel video di destinazione.
- L’audio potrebbe non sembrare corrispondere alla persona, specialmente se il video è stato falsificato ma l’audio originale non è stato manipolato con la stessa cura.
- E’ particolarmente difficile, invece, individuare un deepfake in una fotografia
Come sono fatti?
I ricercatori universitari e gli studi di effetti speciali hanno a lungo spinto i confini di ciò che è possibile con la manipolazione di video e immagini. Ma i deepfakes stessi sono nati nel 2017 quando un utente di Reddit con lo stesso nome ha postato clip porno ritoccati sul sito. I video hanno scambiato i volti delle celebrità – Gal Gadot, Taylor Swift, Scarlett Johansson e altri – con quelli degli attori porno.
Ci vogliono alcuni passi per fare un video face-swap. In primo luogo, si eseguono migliaia di scatti di facce delle due persone attraverso un algoritmo AI chiamato encoder. L’encoder trova e impara le somiglianze tra le due facce, e le riduce alle loro caratteristiche comuni condivise, comprimendo le immagini nel processo. Un secondo algoritmo di intelligenza artificiale chiamato decodificatore viene quindi insegnato a recuperare i volti dalle immagini compresse. Poiché i volti sono diversi, si addestra un decoder per recuperare il volto della prima persona e un altro decoder per recuperare il volto della seconda persona. Per eseguire lo scambio di facce, è sufficiente inserire le immagini codificate nel decodificatore “sbagliato”. Per esempio, un’immagine compressa del volto della persona A viene inserita nel decoder addestrato sulla persona B. Il decoder ricostruisce quindi il volto della persona B con le espressioni e l’orientamento del volto A. Per un video convincente, questo deve essere fatto su ogni fotogramma.
Un altro modo per fare deepfakes usa quella che viene chiamata una rete generativa avversaria, o Gan. Un Gan mette due algoritmi di intelligenza artificiale uno contro l’altro. Il primo algoritmo, noto come generatore, viene alimentato con un rumore casuale e lo trasforma in un’immagine. Questa immagine sintetica viene poi aggiunta a un flusso di immagini reali – di celebrità, ad esempio – che vengono alimentate nel secondo algoritmo, noto come il discriminatore. All’inizio, le immagini sintetiche non sembreranno affatto dei volti. Ma ripetendo il processo innumerevoli volte, con un feedback sulle prestazioni, il discriminatore e il generatore migliorano entrambi. Con abbastanza cicli e feedback, il generatore comincerà a produrre volti assolutamente realistici di celebrità completamente inesistenti.
Di quale tecnologia avete bisogno?
È difficile fare un buon deepfake su un computer standard. La maggior parte viene creata su desktop di fascia alta con potenti schede grafiche o meglio ancora con potenza di calcolo nel cloud. Questo riduce il tempo di elaborazione da giorni e settimane a ore. Ma ci vuole anche esperienza, non ultimo per ritoccare i video completati per ridurre lo sfarfallio e altri difetti visivi. Detto questo, sono ora disponibili molti strumenti per aiutare le persone a fare deepfake. Diverse aziende li realizzano per te e fanno tutta l’elaborazione nel cloud. C’è anche un’applicazione per cellulari, Zao, che permette agli utenti di aggiungere i loro volti a una lista di personaggi televisivi e cinematografici su cui il sistema si è allenato.
Le Migliori app e risorse online per creare deepfake per divertimento
Nota: anche se la tecnologia deepfake non è ancora abbastanza buona per ingannare completamente le persone, è importante usare i deepfake in modo etico. Non usare la tecnologia deepfake per scopi illegali, e sicuramente non usare le foto/video di qualcun altro senza il suo esplicito permesso.
Zao
Zao è l’ultima app che è diventata virale in Cina per la sua ingegnosa capacità di creare video deepfake in pochi secondi. È possibile scegliere un video clip dalla sua libreria che include scene di serie drammatiche cinesi, Big Bang Theory, film popolari di Hollywood e altro ancora. In pochi secondi, Zao crea un video deepfake apparentemente autentico che francamente sembra naturale e indistinguibile dal video originale. La cosa sorprendente è che l’app richiede solo pochi secondi, a differenza dei potenti computer che possono impiegare ore per addestrare la Generative Adversarial Network responsabile della creazione di video deepfake.
Per quanto riguarda la disponibilità, l’app Zao è rilasciata solo in Cina sia per gli utenti Android che iOS. È possibile sideload l’app su Android, ma non è possibile utilizzarla perché Zao richiede un numero di telefono cinese per l’iscrizione. Tuttavia, siamo riusciti a testare l’app Zao in India e funziona per la maggior parte. Nel nostro test, abbiamo scoperto che sui volti indiani, non sembra così naturale come ci si aspetterebbe. Potrebbe essere perché Zao è principalmente addestrato su dati facciali cinesi. Tuttavia, Zao è un’app interessante e potrete provarla una volta che sarà disponibile per tutti.
Pro
- Richiede solo una foto per esplorare tonnellate di possibilità di styling
- Crea le tue emoticon speciali
- Ottieni lo stesso stile di celebrità con un solo tocco
Contro
- Gli utenti non possono salvare o fare screenshot
Nota: La società dietro l’app Zao aveva precedentemente menzionato nel contratto con l’utente che possono riutilizzare le immagini create sulla sua app per tutti gli scopi. Tuttavia, dopo pesanti critiche, hanno ritrattato il passaggio controverso. Tuttavia, se siete preoccupati per la vostra privacy, vi consigliamo di non usare affatto l’app.Visita il sito web: Android / iOS – Gratis
Deepfakes web β
Deepfakes web β è un servizio web che permette di creare video deepfake sul web. Utilizza l’apprendimento profondo per assorbire le varie complessità dei dati dei volti. Deepfakes web β può richiedere fino a 4 ore per imparare e addestrare da video e immagini, mentre ci vogliono altri 30 minuti per scambiare i volti utilizzando il modello addestrato.
Anche se utilizza una potente GPU sul cloud, può richiedere ore per renderizzare tutti i dati. Continua a dimostrare che la creazione di video deepfake non è un gioco da ragazzi e vedere Zao farlo in pochi secondi è davvero rivoluzionario. In ogni caso, se si vuole provare il deepfake video per la ricerca in computer vision, si può andare per Deepfakes web β.
Pro
- Veloce e facile da usare
- Genera deepfake di alta qualità
- Ogni deepfake ha un watermark chiaro e visibile per indicare che il video non è reale
Contro
- Gli utenti devono registrarsi per usarlo
Visita il sito web (a pagamento, 2 euro/ora di utilizzo)
Wombo
Se non avete vissuto sotto una roccia, è probabile che abbiate già visto alcune clip di Wombo. Per chi non lo sapesse, Wombo è una App che permette di trasformare se stessi o altri in una faccia che canta. Si può scegliere tra 15 canzoni e far cantare il personaggio, il tutto da una sola immagine. Questa app è di gran moda in questo momento e sta conquistando Reels e TikTok in tutto il mondo.
Visita il sito: Android / iOS (gratis, acquisti in-app)
Reface
gli sviluppatori di Doublicat hanno rinominato l’app in Reface, dopo Reface IA. Reface IA è la Generative Adversarial Network (GAN) dietro le quinte. Per utilizzare l’app, tutto quello che devi fare è catturare la tua foto e poi scegliere la gif che vuoi utilizzare.
In pochi secondi, l’applicazione sovrapporrà la vostra faccia alla gif. Non funziona perfettamente e la sovrapposizione del viso dipenderà dalla simmetria del vostro viso e dalla gif che state usando. Detto questo, ci sono così tante gif su internet che avrete sempre delle opzioni. Questa può essere la vostra app per creare gif personalizzate che potrete usare per impressionare i vostri amici.
Pro
- Gioca con scambi di facce dal vivo, scambi di genere
- Ogni giorno vengono pubblicati nuovi video e GIF
- Scambia la tua faccia con personaggi del cinema o celebrità
Contro
- A volte l’app mostra ‘errore sconosciuto’ e si blocca senza motivo
Visita il sito web: Android / iOS – Gratis (acquisti in-app)
MyHeritage
Un’altra app di deepfake virale che dovresti provare si chiama MyHeritage. La funzione Deep Nostalgia dell’app ha guadagnato popolarità tra gli utenti dei social media perché permette di animare vecchie foto. Per utilizzare il servizio, tutto quello che devi fare è caricare un’immagine e premere il pulsante di animazione.
In pochi secondi, si ottiene una versione animata dell’immagine con la faccia, gli occhi e la bocca che si muovono come se fosse uscita direttamente dal giornale magico The Daily Prophet di Harry Potter. Potete controllare l’immagine di uscita proprio qui:
Visita il sito web: Android / iOS / Sito web (gratis)
DeepFaceLab
DeepFaceLab è un programma per Windows che permette di creare video deepfake. È costruito principalmente per i ricercatori e gli studenti di computer vision. Tuttavia, se volete imparare i video deepfake, potete sicuramente provare questo strumento. Utilizza l’apprendimento automatico e la sintesi delle immagini umane per sostituire i volti nei video.
Poiché DeepFaceLab è uno strumento avanzato principalmente per i ricercatori, l’interfaccia non è user-friendly e dovrete imparare il suo utilizzo dalla documentazione. Ancora, va da sé che avete bisogno di un PC potente con una GPU dedicata di fascia alta. In poche parole, se sei uno studente specializzato in computer vision, DeepFaceLab può essere un ottimo strumento per capire i video deepfake.
Pro
- Un sistema di deepfake open-source
- Pipeline flessibile e facile da usare
- Gli utenti possono scambiare e de-invecchiare i volti senza soluzione di continuità
- Include modelli preaddestrati fatti dalla comunità e faceset pronti per il lavoro
Contro
- La sostituzione della voce non è inclusa
Visita GitHub (gratis)
Deep Art
Deep Art è un’altra app che è diventata virale qualche settimana fa. Non è un’app di deepfake video, tuttavia, può creare immagini deepfake basate su arte, strutture antiche e dipinti. Mentre ci sono molte app che hanno caratteristiche simili, la parte unica di Deep Art è che utilizza l’intelligenza artificiale per trasformare qualsiasi foto in un’opera d’arte.
L’algoritmo altamente avanzato si dice sia ispirato al cervello umano e utilizza elementi stilistici di opere d’arte popolari per ricreare immagini artistiche. Deep Art è allenato dalle opere di vari artisti che includono Van Gogh, Leonardo da Vinci, Michelangelo, Picasso e altri. E la parte migliore è che non c’è nessun problema di privacy con questa app. Se volete provare qualcosa di artistico, Deep Art è la migliore app da provare.
Visita il sito web: Android / iOS – (gratis, acquisti in-app)
Face Swap
Face Swap non è interamente un’app di deepfake, ma ti permette di scambiare la faccia con un tuo amico o una foto nei video, ed è una delle migliori app di scambio di facce disponibili. Puoi registrare video, mettere adesivi, scattare foto e pubblicarle direttamente sui social media. Quello che mi piace di questa app è che, a differenza di altre app di scambio di facce, non è così statica e c’è un certo grado di movimento sul viso. Ci sono anche effetti 3D, deformazione interattiva del viso con diverse maschere ed effetti. Tutto sommato, se siete alla ricerca di un’app deepfake, Face Swap Live può essere una grande alternativa di Zao per il momento.
Pro
- Un sistema di deepfake open-source
- Salva automaticamente il modello di allenamento, in modo da potersi fermare in qualsiasi momento
- Genera deepfake di alta qualità
Contro
- Richiede una GPU moderna con CUDA per le migliori prestazioni
Visita il sito web: Android (gratis), iOS (0,99 euro)
FaceApp
FaceApp è un’app popolare ed è in effetti una delle prime poche app a rendere veramente popolare e democratico il deepfake e l’editing del viso generato dall’IA sugli smartphone. Con FaceApp puoi semplicemente caricare la tua foto sull’app e poi vedere come sarai da vecchio, farti sorridere e altro ancora. Come accennato in precedenza, l’app utilizza l’IA per modificare le foto in modo che sembrino abbastanza realistiche. Non solo questo è un modo meraviglioso per avere qualche risata con i tuoi amici, ma è anche ottimo se hai vecchie foto e vuoi che abbiano i soggetti sorridenti invece che seduti con la faccia dritta.
Pro
- Perfeziona i tuoi selfies con i filtri d’impressione
- Ingrandire o minimizzare facilmente i tratti del viso
- Regola la saturazione delle temperature e altro ancora
- Confrontare il prima e il dopo ad ogni passo
Contro
- La versione gratuita mette watermaker sull’immagine elaborata
Visita il sito web: Android (gratis), iOS (gratis)
Jiggy
Uso spesso Giphy per creare GIF sul mio Mac, e condividerle con i miei amici su WhatsApp, iMessage, ecc. Tuttavia, Jiggy porta questo processo un passo avanti. Con questa applicazione, è possibile creare deepfakes di GIF e mettere te stesso in qualsiasi GIF che ti piace. Piuttosto figo, vero? Tutto quello che devi fare è scegliere una tua foto e selezionare la GIF in cui vuoi essere presente. Questo è tutto, Jiggy userà poi la sua intelligenza per mettere la tua foto nella GIF, con tanto di animazione! È un modo divertente per creare GIF personalizzate e personali che saranno sicuramente più divertenti da condividere.
Visita il sito web: Android (gratis), iOS (gratis)
FacePlay – Video di scambio di volti
Piattaforma: iOS
| Android
Prezzo: Gratuito | La versione Premium costa 6 euro al mese
FacePlay utilizza l’immagine di una persona e un volto di destinazione per combinare le due caratteristiche facciali in una sola. È un’applicazione dal funzionamento semplice che vi aiuta nel processo di creazione di un video (breve clip) del vostro viso.
L’applicazione contiene numerosi modelli di video brevi che cambiano la faccia. Basta selezionarne uno, cliccare sulla tua foto e diventerai il protagonista del video. È anche possibile aggiungere effetti speciali al video e condividerlo con gli amici. Nel complesso, è un’app divertente per creare contenuti unici e ottenere più like sui social media.
Progetto Morpheus di Adobe
Piattaforma
: Prodotti Adobe
Nel 2021, Adobe ha annunciato un prototipo di strumento chiamato Project Morpheus, dimostrando i vantaggi e gli svantaggi dell’integrazione della tecnologia deepfake nei suoi prodotti.
L’azienda sta sviluppando potenti tecniche di editing video del viso che possono modificare automaticamente l’aspetto degli utenti con risultati uniformi e coerenti. Per esempio, la tecnologia permetterà agli utenti di regolare la loro età, lo spessore dei capelli e altri aspetti del viso in un video. L’obiettivo è quello di fornire un modo completamente nuovo di creare e modificare contenuti.
Tuttavia, i risultati non sono impeccabili (per ora) e sono abbastanza limitati in relazione ad altri strumenti di deepfake. Gli utenti possono fare solo piccole modifiche e non possono fare cose come lo scambio di facce.
Deepfake: in conclusione
Domande frequenti
Gli strumenti Deepfake si basano su un tipo speciale di rete neurale artificiale nota come autoencoder. Esso contiene due componenti:
- Encoder – riduce l’immagine (presa dal video originale) a uno spazio latente di dimensioni inferiori
- Decoder – ricostruisce l’immagine dalla rappresentazione latente
La rappresentazione latente consiste in dati cruciali, come le caratteristiche facciali e la postura del corpo, che possono essere decodificati con un modello addestrato in particolare per l’obiettivo. I dati dell’obiettivo sono sovrapposti alle caratteristiche facciali e corporee sottostanti del video originale.
I moderni strumenti di deepfake utilizzano una rete generativa avversaria (GAN) per rendere i video più realistici. La GAN è fatta di due componenti: generatore e discriminatore. Il generatore costruisce nuove foto dalla rappresentazione latente, mentre il discriminatore individua gli errori nelle foto. Questo aiuta il generatore a costruire foto che imitano molto bene la realtà. In questo modo, sia il generatore che il discriminatore migliorano continuamente in un gioco a somma zero.
Anche se i ricercatori hanno fatto miglioramenti significativi nel rilevare i deepfakes dall’aspetto realistico, si stima che i deepfakes potrebbero un giorno diventare un’arma potente per l’hate speech, la disinformazione politica o la diffusione di bugie sulle piattaforme sociali.
L’unica soluzione ovvia è quella di utilizzare l’intelligenza artificiale stessa per rilevare questi video falsi. Tuttavia, fino ad oggi, un programma affidabile di rilevamento dei deepfake è rimasto sfuggente.