Quell'ultima cosa che ci salva (dall'essere ingannati dai video AI)

Sì, quell'opossum virale era finto: una piccola guida sui video generati con AI e perché ce ne frega qualcosa.

Quell'ultima cosa che ci salva (dall'essere ingannati dai video AI)

Forse avrai visto il video virale di un opossum che vede un suo riflesso nello specchio e colto di sorpresa "si finge morto".
La clip ripubblicata da RDS ha oltre 6 milioni di visualizzazioni, ma ce ne sono diverse altre versioni su Instagram, TikTok e Youtube. Purtroppo ti deludo: è un video finto, generato con AI.

Ma come possiamo accorgercene? In questa lettera farò una piccola guida empirica su cosa funziona per riconoscere i video AI. Andremo a ritroso, partendo dagli indizi più circostanziali, per concludere su quelli più profondi, e alla fine vi condivido il mio pensiero sull'uso di AI nel campo artistico e audiovideo.

Se non mi conosci, ciao! Sono Martino e parlo del rapporto tra intelligenza artificiale e società, dell'impatto della tecnologia, e di altre cose. Mi trovi anche sui social come @oradecima (Instagram, Bluesky, YouTube).

Come riconoscere i video generati con AI

L'altro giorno ho pubblicato questo video che contiene una buona parte dei ragionamenti che faremo nei primi capitoletti; ma scriviamoli:

parte 1: indizi visivi

Il primo step per analizzare un video sospetto è guardarlo piano, frame per frame, specialmente se è un video lungo.
I sistemi che generano video sono oramai abbastanza coerenti: i soggetti riescono a non venire trasformati in modo assurdo come accadeva l'anno scorso, tuttavia non sono ancora perfetti, soprattutto se il video è complesso e ritrae umani.

Perciò, guardando frame per frame possiamo notare delle incongruenze. Nel caso dell'opossum, a un certo punto da un frame all'altro un orecchio cambia in modo inspiegabile.

Nei commenti del video mi è stato detto che gli animali possono ruotare le orecchie –il che naturalmente è vero– ma il punto è che il movimento qui è istantaneo e incoerente con il prima e il dopo: come se vedessi una persona che gira la testa di 90 gradi in un millisecondo: certo che le persone possono girarsi, ma magari con qualche step intermedio.

A volte poi potrebbe succedere che i video oltre una certa lunghezza siano montati da due clip diverse generate con AI, e nei momenti "di connessione" si potrebbe notare anche lì un frame di incoerenza, provate a farci caso oltre alla decina di secondi.

Ma l'indizio visivo più grosso è quello del riflesso una volta che l'opossum si è ribaltato:

questa prospettiva, se la osservate con calma, non ha senso. La bocca dell'opossum è rivolta completamente verso di noi, perciò perché appare nello specchio? La testa nel riflesso non è girata nel modo corretto.

parte 2: quella telecamera molto conveniente e altri trucchi

Proviamo a pensare come una persona che vuole coprire i difetti dei video AI. Al di là delle incongruenze, un'altra cruciale limitazione dei video AI sono la risoluzione e la nitidezza: Veo 3.1, l'attuale migliore versione del modello di Google per generare video, arriva a generare al massimo video a 1080p (ma più spesso a 720p, a seconda dei piani che avete).

Tenete conto che il primo iPhone a registrare in 4K, quindi che raddoppia la risoluzione di ogni lato rispetto al 1080p, fu l'iPhone 6S uscito nel 2015, e lo poteva fare anche già l'anno prima il Samsung Galaxy S5.
Naturalmente chiunque sa qualcosa di video a questo punto mi può obiettare che la risoluzione non è tutto, e che ci sono fior fior di dispositivi che registrano a 1080p mille volte meglio di qualsiasi iPhone in 4K. Ed è vero.

La risoluzione indica solamente il numero di pixel, che non corrisponde però alla reale nitidezza del video e di quanti dettagli catturi.
Ci fa però da guida per dire che i video generati con AI faticano a raggiungere il livello di dettagli delle fotocamere dei telefoni che abbiamo in tasca; questo è immediatamente evidente quando vengono ritratte persone, che finiscono per sembrare bambole prive di pori.

In generale i video AI appaiono spesso un po' pastosi e troppo puliti (mentre gli smartphone tendono ad eccedere in eccessiva nitidezza artificiale, ma sarebbe un altro discorso).

Se dunque vogliamo nascondere questo limite, il modo migliore è generare video che ci aspettiamo che siano a bassa risoluzione o che in generale siano brutti: per esempio quelli delle telecamere di sorveglianza.
Le telecamere di sorveglianza vere sono a bassa risoluzione, spesso riprendono da lontano, magari in bianco e nero, e magari una scena buia: vedere un risultato a bassa qualità non ci stupisce.
Un video generato come se girato da una telecamera di questo tipo, come i video virali degli animali che saltano sul trampolino di notte, maschera le imperfezioni tipiche dell'AI e le fa coincidere con quelle di una vera telecamera notturna.

sembra proprio che si divertano...

parte 3: quella in cui devi proprio usare il cervello

"Ma questo video, ha senso di esistere?"

La domanda della parte 3 è questa, e in realtà dovrà essere la prima che ci poniamo quando guardiamo un video, che innesca tutto il resto dell'indagine.

Il video dell'opossum per esempio è troppo perfetto. C'è un opossum in un ambiente non meglio definito (una cantina, una soffitta, una capanna in giardino?) con uno specchio in perfette condizioni che è guardacaso a favore di telecamera, che è accesa, e la scena è anche illuminata decentemente. È, letteralmente, troppo bello per essere vero.

Che ci fa quello specchio lì? Perché questo ambiente è illuminato? Chi si è preso la briga di posizionare la telecamera in modo che non compaia nel riflesso dello specchio? Sembra costruito a tavolino per essere virale, perché è proprio così.

Oltre alla scena, interroghiamoci sul protagonista, il nostro caro opossum. È plausibile questa reazione? Certamente è vero che a volte gli animali fanno cose molto divertenti e inaspettate. In questo caso però, non vi sembra un po' troppo da cartone animato questa reazione?

C'è la comune conoscenza che gli opossum si "fingano morti" quando si sentono in pericolo...ma come funziona effettivamente? Per molte persone, me compreso, era un'idea piuttosto nebulosa; è tipo una recita, una performance?

In realtà no: la tanatosi negli opossum è una risposta involontaria nel momento in cui un predatore attacca; non mi spingo a indagare oltre perché non è il mio campo, ma il punto è che nel video l'opossum ha una risposta veramente esagerata e irrealistica. Il video migliore che sono riuscito a trovare di un opossum vero che ha questo comportamento è questo, e potete notare quanto sia diverso:

I sistemi AI in parte in effetti imparano anche dai cartoni animati quei movimenti esagerati, ma soprattutto noi stessi ovviamente abbiamo tante concezioni errate che ci tramandiamo, perché alla fine chi l'ha mai visto dal vivo un opossum della Virginia?
Invece magari abbiamo visto Il Robot Selvaggio, in cui la mamma opossum sviene in modo plateale, con la gag dei figli che si immaginano ognuno una malattia con cui fingere di morire:

Un po' come la concezione errata che i conigli siano golosi di carote, che è nata dalle classiche scene di Bugs Bunny che mangia la carota...che in realtà erano una reference a Clark Gable e non ai conigli. Assurdo no?

Insomma, per concludere, se un video sembra troppo bello per essere vero, forse lo è.
C'è ancora un'ultima considerazione da fare.

parte 4: cercare tracce

se avete già visto il video breve, questa è la parte aggiuntiva che vi promettevo

C'è un ultima arma che abbiamo, che non è nuova ma rimane efficace: da dove arriva questo video?
Rintracciare la fonte primaria di un contenuto o di un'informazione è sempre un buon metodo per prevenire misinformazione e disinformazione, e vale anche per capire quanto è probabile se un contenuto sia AI.

Nel video di RDS fortunatamente troviamo una fonte del video, l'account TikTok @zip.handle, da cui troviamo facilmente il video TikTok del 5 novembre, che ha circa 55mila visualizzazioni. Che altro troviamo?

gli ultimi video di @zip.handle

Non molto: non c'è un tema coerente ai video, delle informazioni su chi detiente l'account, che soprattutto è pieno di video palesemente freebootati da altri account, come ad esempio in basso a destra un video di Big Manny (di cui vi consiglio i contenuti).

Vedendo questo account è abbastanza probabile che il video non nato qui: se lo fosse, e soprattutto se il video fosse reale, ci sarebbero probabilmente dei video di follow up o delle interazioni ulteriori, e invece nada. Cercando online si trova una versione (con 23 milioni di visualizzazioni) postata il giorno prima, il 4 novembre, dal creator Evan Era. Anche lui però carica molti video presi altrove online, quindi non sembra essere l'effettivo creatore del video.

Nei commenti del video di Era ci sono varie persone che si interrogano se sia AI, e c'è questo scambio meraviglioso: utente dice che gli opossum veri non hanno questa reazione, e nella risposta viene linkato un altro video in cui un opossum ha una reazione "esplosiva" e si ribalta...ma ovviamente anche quel video è AI.

Il fatto che non si trovi una buona fonte, che non ci siano altri contenuti di contorno o informazioni chiare sul contesto è una buona indicazione che di questo video dovremmo fidarci poco. Controllare le fonti di una informazione è una buona pratica da ben prima dell'avvento dell'AI, e penso che ci sia utile ricordarlo: anche se le tecnologie avanzano ci sono delle pratiche che continuano a funzionare bene.

happy hunting. più giù, nei link interessanti, vi condivido un altro creator che fa un grosso lavoro su questo tema che vi consiglio.

cosa ne penso al momento sull'uso dell'AI per fare immagini e video

Volevo scrivere un paragrafo a chiusura di questo tema che avrà probabilmente solo il risultato di inimicarmi qualcuno.
Sul tema dei contenuti generati con AI trovo spesso un discorso molto appiattito: da una parte gli entusiasti, gli "AI artist" che elogiano qualsiasi forma di AI e nuovo strumento e che ripudiano qualsiasi strumento tradizionale. Dall'altra gli oppositori, per i quali gli strumenti AI sono totalmente inutili nonché deleteri, indistintamente.

Mi trovo, come per molte questioni, un po' a metà. Penso che con gli strumenti di AI generativa sia possibile fare arte, perché penso che concettualmente con qualsiasi cosa si possa potenzialmente fare arte. Allo stesso tempo, penso che usare l'AI acriticamente sia noioso e mediocre.

Gli strumenti AI hanno senso di essere usati quando sappiamo che sono il modo più adatto per ottenere qualcosa, mentre mi capita di vedere prodotti in cui l'AI non è un mezzo per esprimere una certa visione artistica ma è fine a se stesso, come se il traguardo fosse il poter dire "wow l'ho fatto con l'AI" anche se il risultato non è interessante e poteva venire meglio in altro modo.

Viceversa, penso sia miope negare che specialmente certi strumenti che usano l'AI generativa abbiano una utilità artistica concreta che non toglie davvero niente all'artista: mi viene in mente l'esempio del riempimento generativo di Photoshop o Lightroom, che permettere di fare ritocchi alle nostre foto utilizzando l'AI generativa di Adobe. Sono strumenti che semplicemente velocizzano un'operazione che non era nemmeno divertente, come il rimuovere qualche macchia o piccoli oggetti che distraggono o persone sullo sfondo, e che adesso si riesce a fare più agilmente di prima.

In aggiunta, credo che gli strumenti AI possano aiutare a creare prodotti o immaginari nuovi, come nella campagna di Italia Impossibile che vuole reimmaginare gli spazi pubblici più verdi e a misura d'uomo, e lo fa (anche) modificando con strumenti di AI generativa delle foto esistenti, per trasmettere la dimensione del sogno in modo concreto.

Sul tema ambientale penso vada fatto un discorso a parte, per bene, che pubblicherò in qualche forma a breve.

Questa guida insomma non è da intendersi come guida "anti-AI" in toto, ma come guida per contrastare gli inganni fatti utilizzando l'AI generativa. Poi magari nella prossima newsletter parliamo della pubblicità di McDonald's fatta con l'AI e criticatissima, e dell'accordo tra Disney e OpenAI, iscriviti se ne vuoi sapere!


Cosine interessantine

📚 Cosa leggono uomini e donne, veramenteè uscito un nuovo pezzo mio e di Beatrice Petrella su siamomine in cui guardiamo l'hobby della lettura dalla lente dei social, partendo da una domanda: ma come mai gli uomini leggono meno delle donne? e come mai leggono decisamente più saggi che narrativa?
Sono contento di questo pezzo perché ho potuto scrivere qualche riga su uno dei miei libri spreferiti, ovvero Padre Ricco Padre Povero.

🧍"Siete inutili" dice la ministra dell'università – In risposta a degli studenti che protestavano ad Atreju, la ministra dell'università Bernini risponde "siete inutili"; ho trovato molto interessante questo video di Irene Lo Faro che risponde e analizza perché è così problematico usare il verbo essere per dire sei inutile invece di "fai qualcosa di - inutile"

🐱 Il Washington Post prova a capire come TikTok ci categorizza – facendo un analisi dei video visualizzati da un migliaio di utenti e raggruppando i diversi interessi. Analisi interessante, che ovviamente non racchiude in modo esaustivo l'algoritmo di TikTok, ma prova a osservare come si intrecciano gli interessi delle persone.

🕵️‍♂️ Jeremy Carrasco @showtoolsai analizza video per capire e far capire se siano generati con AI o meno. Fa un bel lavoro, ve lo consiglio!

✉️ Le email sono veramente faticose a volte, no?

🔌 L'incredibile storia dietro l'installazione delle porte USB su mezzi di trasporto e altrove – avete notato che ormai sono molto diffuse le prese con le porte USB?

👨‍👩‍👧‍👦 Consiglio per le feste se volete parlare di politica in famiglia: invece di provocarsi a vicenda, cercare punti di contatto. Charles McBryde consiglia di parlare ai propri parenti [conservatori] calibrando le parole in modo da non far alzare subito un muro. Lui parla del contesto USA, ma penso sia una mentalità applicabile ovunque.
Se online è quasi impossibile confrontarsi con persone con idee politiche molto diverse, offline e con persone che si conoscono penso sia realmente possibile parlarsi. Il tema non è arrivare "a metà strada" in modo democristiano, perché ci sono delle posizioni che la metà strada non la meritano; penso che il discorso sia più avere la cura di disinnescare gli scudi che le persone si creano.

🥛 Cosa fare quando hai un amico che vuole fare un lavoro obsoleto – Xander Kerber è uno dei miei nuovi creator preferiti, adoro i suoi sketch, fanno pisciare sotto.

🐦‍⬛ Ma lo sapevate del mio format di serate di intrattimento basato su PowerPoint?? Con la mia amica Francesca Cordioli ci trovate ogni mese a Sinestetica, a Roma, per delle serate in cui vi convinciamo delle nostre tesi su argomenti futili: non siamo assolutamente seri, ma ogni tanto si impara anche qualcosa. Venite a trovarci e seguiteci su @argomentifutili


per concludere, se hai trovato questa newsletter utile o interessante, la condivideresti con qualche persona? Nelle lettere riesco a portare qualcosa di più approfondito, perciò vorrei dedicarmici di più, ma ad oggi il tempo che le do è poco giustificato in termini di quante persone raggiunge rispetto a un video. proviamo a cambiarlo?

E come sempre, grazie per la lettura 👋

E buone feste!