Logo
Il “coso”, spiegato per intero. Perché la superficialità sull’IA generativa fa danni
Foto di repertorio

Sull’intelligenza artificiale si scrive molto, spesso troppo, quasi sempre male a volte molto male

Sull’intelligenza artificiale si scrive molto, spesso troppo, quasi sempre male a volte molto male. Il problema non è l’IA: sono i commentatori armati (forse?) di buone intenzioni (o protagonismo?), cattivi concetti e una penna (la tastiera?) che corre più del pensiero. Così, invece di chiarire, confondono e disinformano. E la confusione, in tecnologia, è letale.

La prima verità, quella che nessuno sembra voler dire per intero, è anche semplice: un modello linguistico non “pensa”. Calcola. Il “coso” funziona trasformando un testo (la domanda o anche il processo di addestramento) in token (frammenti di testo) con sua statistica associata, manipolato come numeri e, in risposta, riconvertito in parole. Non c’è spirito, moralità o intuito. Ci sono i parametri (qualche trilione – nessuno lo sa – per ChatGPT), statistica e calcolo. Una matematica statistica anche molto complessa, sì, ma pur sempre numeri. Poi ci sono filtri etici, filtri piacioni, manipolazioni di vario tipo, ma è roba aggiunta. Di qui il successo di Nvidia che faceva le schede per i videogiochi, e ha avuto la fortuna che il calcolo semplice della GPU si adattasse perfettamente alle esigenze computazionali della IA generativa. Chi non parte da qui, parte storto, molto storto.

Seconda verità: l’addestramento è fondamentale. Non esiste IA senza i dati in quantità che la hanno istruita (addestrata), consentendo alla rete neurale di registrare e tarare le sue statistiche interne. Cambia il dataset, cambia la risposta del modello; cambia il modello (quelli opensource liberamente scaricabili sono circa 1 milione; si avete capito bene. 1 con sei zero dietro), cambiano le sue “risposte” (erroneamente antropomorfizzate in “opinioni”). Parlare di IA come di un’entità autonoma, scissa dal processo di addestramento, è come discutere di un violinista ignorando il fatto che ha studiato dieci anni di conservatorio o sia un neofita.

Terza verità, spesso ignorata con leggerezza: la context window, la memoria a breve termine utilizzata nel dialogo con il modello. Non è un dettaglio tecnico da ingegneri nerd: è ciò che determina quanto il modello sintetizza statisticamente (“capisce” nella allegoria antropomorfa) del problema che gli poni. Una finestra corta, e il modello ragiona come chi ascolta a metà. Una finestra lunga, e può davvero “seguire” un discorso complesso. Il contesto è ossigeno: senza, il modello ansima. ChatGPT ha una finestra di 128k token, circa 100k parole.

Quarta verità: il prompt conta, ma non è l’oracolo. Dire che “basta il buon prompt” è come sostenere che una buona domanda trasformi un microfono in un cantante lirico. Il prompt è un comando, non un miracolo. Funziona se — e solo se — l’addestramento, il modello e il contesto supportano la richiesta.

In altre parole: il prompt è l’innesco, non il motore.

Tutto questo funziona insieme, non a pezzi. Testo-numeri-modello-contesto-prompt: una catena che lavora bene solo se ogni anello è solido. Chi isola un frammento e ci costruisce sopra una teoria morale, giuridica o antropologica, fa un favore alla disinformazione.

E qui arriva l’ultimo punto, il più doloroso: gli articoli superficiali sull’IA non sono innocui. Sono dannosi, assai.

Perché creano cittadini spaventati da un fantasma e amministratori e professionisti che non usano lo strumento solo per ignoranza, non per ragionata prudenza. Perché trasformano un utensile potentissimo — sì, il coso — in un totem da venerare o in un mostro da temere. In entrambi i casi, il risultato è lo stesso: nessuno capisce nulla e tutti ci perdono.

L’IA va capita, non demonizzata; studiata, non evocata; spiegata, non mitizzata o storpiata.

Serve precisione nei termini, lucidità nei concetti e onestà intellettuale. Tre cose rare, si dirà, ma indispensabili se si discute di IA generativa. Il termine “generativa” specifica questa particolare tecnologia per non farla confondere con le tantissime altre tecniche precedenti di IA (come il deep learning). E tutto iniziò nel 2017 con un articolo di ricercatori Google e accademici dal titolo emblematico: “Attention is all you need”. Il “coso” dunque calcola e non pensa. Ma chi scrive dovrebbe farlo.