Dai chatbot agli agenti: il cambio di paradigma che nessuno ha ancora capito

Negli ultimi sei mesi le capacità tecniche degli LLM hanno fatto dei salti dopoio-carpiato che la maggior parte delle aziende non hanno ancora capito per davvero.

Ormai non parliamo più di chatbot, quelli sono diventati facili, c@778, sono riuscito a infilarne uno pure nel mio sito malvag.io che pure gira su una macchinetta da 2 euro al mese da Aruba.

Adesso possiamo finalmente parlare davvero di agenti che aprono il terminale, navigano browser, modificano file, eseguono deploy.

Cioè siamo passati dagli LLM che rispondono a quelli che lavorano e la differenza è sostanziale, considerando che ora che gli abbiamo dato delle ‘mani’ (l’accesso alle consolle dei nostri sistemi operativo n.d.r.) queste macchinette stanno per davvero cominciando ad automatizzare task non più semplici.

Peraltro i modelli open source si stanno avvicinando molto a quelli di frontiera. Ad esempio, DeepSeek offre perdormance alte, costi bassi, possibilità reale di girare on-premise.

L’AI dei prossimi mesi - quindi - non sarà più solo roba da hyperscaler e chi sta costruendo dipendenze totali da OpenAI o da M$ Copilot sta replicando esattamente il lock-in del cloud che abbiamo impiegato dieci anni a capire fosse un problema.

E il valore - per di più - si sta spostando dal modello all’orchestrazione.

Questo vuole anche dire che le tematiche di sicurezza stanno diventando realmente importanti: più i modelli vengono implementati con policy di sicurezza fallaci tanto più aumenta la superficie d’attacco, tanto che le prompt injection sono diventate frequenti, ricercate e devastanti quanto lo erano state le SQL injection al tempo dei database relazionali.

D’altronde se un agente legge dati, naviga contenuti e può agire nel mondo reale, può anche essere manipolato da quei contenuti. La cybersecurity non è più separata dall’AI engineering, sono la stessa cosa.

La domanda che si dovrebbe fare ogni CTO e CIO a questo punto è se stiamo costruendi dei perimetri di sicurezza attorno agli agenti, e chi nel team sa davvero come isolarli, orchestrarli e non farsi fregare dal primo contenuto malevolo che gli passa davanti.

Chi non lo sa ancora ha un problema e ce l’ha gia adesso.

Previsioni per i prossimi sei mesi

Dai prossimi sei mesi mi aspetto tre cose:

Qualcuno annuncerà che un LLM è stato inserito in organigramma, non una roba seminascosta, un annuncio vero su posizione eccellente, con tanto di comunicati stampa, fanfara e polemiche annesse.
Il primo attacco di prompt injection devastante a qualche entità che si è spinta all’avanguardia nel creare agenti ma che non si è adeguatamente tutelata. Intendo un attacco serio, con breach su sistemi critici e centinaia di migliaia di record clienti esfiltrati.
Alcune aziende che hanno portato in produzione workflow agentici reali e lo hanno manifestato pubblicamente, inizieranno a distaccarsi in modo visibile dalle altre, non solo in termini di efficienza ma anche di velocità decisionale.

Tu cosa ne pensi e che predizioni hai per i prossimi sei mesi?

🎵 Soundtrack: HAUNTED — Isabel LaRosa
Ascolta su Spotify

Previsioni per i prossimi sei mesi

Tu cosa ne pensi e che predizioni hai per i prossimi sei mesi?

Iscriviti alla newsletter malvagia.