Il segno del morso
Cosa cambia con Sora, e perché dovremo rimodellare nuovamente la cultura e l'economia di Internet.
Ciao,
sei su Ellissi, che oggi è supportata da Tate (grazie, sotto trovi tutte le informazioni).
Tra una settimana ci sarà una sorpresa. Un annuncio che rimando da un po’, e che finalmente è arrivato il momento di condividere.
Ma intanto, oggi parliamo del tema tecnologico del momento.
Buona lettura
Valerio
Il segno del morso
In rete circola un video che mostra una gara di biciclette piuttosto inusuale.
Intanto, perché non si svolge su strada, ma sulla superficie dell’oceano.
E poi perché i partecipanti non sono esseri umani: ci sono pinguini, delfini, persino una tartaruga.
Gli animali pedalano affiancati sul pelo dell’acqua, mentre un drone li riprende durante la corsa.
Chi l’ha già visto sa di cosa parlo.
È uno dei primi contenuti generati con Sora, il nuovo servizio di text-to-video lanciato da OpenAI, di cui si parla molto in rete da una decina di giorni.
I filmati che circolano online sono impressionanti per nitidezza, fluidità e fotorealismo.
Ma soprattutto, le immagini sembrano essere leggermente meno perturbanti rispetto a quelle - ormai storia di Internet - delle “mani con sei dita”.
I video di Sora non sono ancora perfetti, ovviamente.
Guardate come i nipoti applaudono la propria nonna mentre quest’ultima cerca di spegnere le candeline sulla torta, senza però riuscirci.
La stessa OpenAI ha spiegato sul suo blog che il software ha ancora diverse falle:
«Una persona potrebbe addentare un biscotto, ma poi quel biscotto potrebbe non avere il segno del morso».
Al momento lo strumento, con cui si possono generare contenuti fino a 60 secondi, è aperto soltanto ai cosiddetti red teamers - specialisti il cui compito è “stressare” il sistema per metterne in luce i bug - e da un ristretto gruppo di artisti, designer e videomaker selezionati dall’azienda.
Per tutti gli altri ci sarà da aspettare. Quanto? Ancora non si sa.
Tecnomagia o tecnorealismo
Il processo di generazione di un video partendo da un prompt testuale è tecnicamente affascinante (se vi interessa, qui e qui trovate due spiegazioni dettagliate su come funziona Sora).
Chi lo usa non deve imparare nulla: lo strumento sembra interpretare la nostra immaginazione, generando in pochi minuti scene - realistiche o fantastiche - di grande impatto.
Quasi una tecnomagia, per usare un termine che Vincenzo Susca ha approfondito in un bel libro dallo stesso titolo: una tecnologia «dai tratti stupefacenti e spaventevoli» che porta all’«obsolescenza di ciò che essa si lascia dietro» e in cui «l’individuo non è più l’attore principale».
Come però ormai abbiamo imparato, lo scrigno dell’AI generativa non contiene davvero pozioni magiche.
I video di Sora - così come i testi di Gemini e ChatGPT, o le immagini di DALL-E e Midjourney - sono creati rielaborando ricchissimi dataset di contenuti già esistenti, che vengono “frammentati” in mille pezzi e “riassemblati” per soddisfare la richiesta dell’utente (mi perdonerete la semplificazione).
Più che invenzioni, i video di Sora sono quindi assimibilabili a dei “remixatori” della realtà: o, come li definisce la stessa OpenAI, a dei «simulatori del mondo fisico».
E benché non sappiamo con certezza su quali video OpenAI abbia usato per arricchire il proprio modello, questo accordo pluriennale siglato nel 2023 con Shutterstock (uno degli archivi di filmati più grandi al mondo) fa presupporre che i suoi contenuti siano stati utilizzati, in larga parte, per “allenare” Sora.
Osservati da una certa prospettiva, gli strumenti di AI generativa si configurano come un intermediario - l’ennesimo, direi - nella filiera creativa digitale.
Come avvenuto in passato con i social, che hanno sviluppato nuovi meccanismi per monetizzare l’attività degli utenti, anche questi tool daranno vita a marketplace che combineranno produzione e fruizione in modo diverso da prima.
Il rischio è che, un po’ come con i social stessi, queste nuove piattaforme terranno per sé la maggior parte del valore generato.
E che lo faranno a discapito di chi siede all’inizio e alla fine della filiera, ovvero produttori e consumatori.
Brian Merchant, autore del libro Blood in the machine, non ha usato mezzi termini:
«È sempre più chiaro che l’AI generativa potrebbe rivelarsi devastante per il lavoro creativo: un enorme spreco di acqua e di energia, e un incubo di copyright per tutti i soggetti coinvolti».
Merchant forse esagera, ma è pur vero che i segnali che vediamo non sembrano garantirci alcuna discontinuità rispetto al passato e alle dinamiche meno virtuose della rete.
In primo luogo, perché i large language model utilizzati dalle aziende sono scatole nere, che sembrano opacizzate ingegneristicamente. Non sappiamo davvero quali dati utilizzino né da dove li prendano.
In secondo luogo, perché il settore dell’AI generativa è dominato da vecchie conoscenze come Microsoft, Google e Meta, che lasciano poco spazio a competitor più piccoli o a eventuali progetti indipendenti e non-profit.
Del resto, la forza delle Big Tech non risiede solo nella possibilità di investire più degli altri, ma anche nell’avere a propria disposizione un giacimento di dati senza eguali (pensiamo a YouTube, a Google Immagini, a Instagram o a Facebook) da cui un giorno attingeranno per allenare i propri modelli.
Gli equilibri di potere dell’internet di domani, insomma, sono già molto simili a quelli di oggi.
I grandi intermediari dell’informazione digitale hanno trovato nell’AI generativa un nuovo arsenale a propria disposizione, un nuovo giacimento di dati da sfruttare.
La soglia dello scraping
In futuro non vincerà solo chi svilupperà la tecnologia migliore, ma anche e soprattutto chi sarà in grado di attingere a dataset di maggiore ampiezza, profondità e qualità: quanti di questi archivi verranno ricompensati a dovere?
E soprattutto, come possiamo fare in modo che a beneficiarne non siano soltanto i soliti noti?
Molti giornali si sono ribellati, e hanno cercato di fermare i bot estrattivi delle AI attraverso i loro robots.txt, per evitare che i loro contenuti vengano estratti senza permesso.
Ma ormai è tardi: il grosso delle informazioni è già stato preso, e simili blocchi rischiano di essere ignorati dai crawler privati.
Intanto, anche etichette discografiche e case di produzione cinematografiche sono in grande allerta, nel timore che gli asset creativi dei loro artisti vengano utilizzati per creare contenuti sintetici.
E fanno bene: arriverà il momento in cui ascolteremo canzoni e guarderemo serie tv generate interamente con l’AI — il tema non è se avverrà, ma quando.
Se arginare l’attività estrattiva dell’AI è difficile per le corporation, pensiamo a quanto lo diventi per i singoli creator e per gli utenti “normali”, che disseminano i propri contenuti su piattaforme i cui termini e condizioni possono essere modificati in ogni momento (Google, per esempio, lo ha già fatto).
In risposta stanno nascendo campagne dal basso come #CreateDontScrape, per proteggere il lavoro creativo, e iniziative come quelle promosse dalla Concept Art Association, ma difficilmente avranno un impatto significativo sul sistema complessivo.
Solo due certezze
Personalmente, sono eccitato da quello che potremo generare in futuro grazie a strumenti come Sora.
A preoccuparmi è però la nascita di nuove diseguaglianze troppo simili a quelle attuali, e l’arrivo di nuovi intermediari for-profit che puntano a spolpare sempre di più la filiera creativa digitale.
Forse, un giorno, i modelli di AI verranno allenati su contenuti creati da altre AI, in un loop circolare (de)generativo in cui gli umani svaniscono del tutto.
Oppure estrarranno i loro dati direttamente dalla natura e dalla realtà che ci circonda, senza bisogno di proxy e dell’intervento di nessuno. Vedremo.
Intanto ci sono due certezze.
Che Sora non è un punto di arrivo, ma l’inizio di qualcosa di nuovo.
E che l'intelligenza artificiale è destinata a rimodellare nuovamente la cultura e l'economia di Internet.
Non manca poi molto.
A breve dovremmo riuscire a vedere il segno del morso.
E a capire chi sarà riuscito a riempirsi la pancia.
Alla prossima Ellissi
Valerio
Tate, energia senza sprecare energie
Tate, fornitore digitale luce e gas, si distingue per l'assistenza clienti e l'esperienza utente.
Niente call-center antiquati, ma una chat rapida e amichevole e un'app intuitiva per gestire il passaggio, consumi e bollette. Paghi l’energia al prezzo di costo, e sai subito il prezzo del servizio.
Anche se a nessuno piace occuparsi delle bollette, è qualcosa che quasi tutti dobbiamo fare. Tate cerca solo di renderne la gestione più semplice e indolore possibile.
Usa il codice ELLISSI30 per avere 30€ di sconto sulle prime due utenze, e ti verranno erogati 5€/mese per 6 mesi.
Nella mia reading list
🟡 A proposito di AI e informazione, un amico sta realizzando un sondaggio anonimo aperto a giornalisti, comunicatori e creator per capire meglio cosa sta succedendo.
🟡 I chatbot ribelli sono stati domati, e ora è diventato tutto più noioso.
🟡 Ricordate gli NFT? Quel settore si sta consolidando, e le aziende che vi operano ora si comprano a vicenda.
🟡 Internet è uno stimolo supernormale.
🟡 Il buon momento per The Cut, magazine americano che si espande mentre gli altri tagliano {via
}.🟡 Cosa hanno in comune un forno a microonde e l’intelligenza artificiale?
🟡 Nulla, solo Zuckerberg che blasta il Vision Pro mentre si costruisce una villa-bunker alle Hawaii.
🟡 L’avanzata della tecnologia trasparente (in senso letterale).
🟡 Il puzzle più difficile mai creato. BEWARE HUMANS!
Trovo sempre interessanti le tue newsletter ma questa lo è in modo particolare. Il problema che poni è attuale e molto sentito da tantissime persone, il fatto è che, proprio come nel caso dell'avvento dei social media, non vedo grandi soluzioni all'orizzonte. Tuttavia già il parlarne crea consapevolezza, quindi grazie!