Il 2025 doveva essere l’anno degli agenti IA, giusto?

Non esattamente, concordano Google Cloud e Replit, due importanti attori e partner nello spazio degli agenti AI. "codifica delle vibrazioni" mossa – in un recente evento della VB Impact Series.

I leader di entrambe le società affermano che, anche se sviluppassero autonomamente gli strumenti di intermediazione, le capacità non sono ancora del tutto complete.

Questa realtà limitata deriva dalle difficoltà con flussi di lavoro legacy, dati frammentati e modelli di governance immaturi. Inoltre, le organizzazioni fondamentalmente fraintendono il fatto che gli intermediari non sono come le altre tecnologie: richiedono un ripensamento e una rielaborazione fondamentale dei flussi di lavoro e dei processi.

Quando le aziende creano agenti per automatizzare il lavoro, “la maggior parte di questi sono esempi di giocattoli”, ha affermato il CEO e fondatore di Replit Amjad Masad durante l’evento. “Si entusiasmano, ma quando iniziano a implementarlo, non funziona davvero.”

Agenti edili basati sugli errori di Replit

Masad ha osservato che i due principali ostacoli al successo degli agenti IA sono l’affidabilità e l’integrazione, piuttosto che l’intelligenza. Se eseguiti per lunghi periodi di tempo, gli agenti spesso falliscono, accumulano errori o non riescono a fornire l’accesso a dati puliti e ben strutturati.

Il problema con i dati aziendali è che sono disordinati, strutturati, non strutturati e archiviati ovunque, e vagliarli è impegnativo. Inoltre, ci sono molte cose non scritte che le persone fanno e che sono difficili da codificare negli agenti, ha detto Masad.

“L’idea che le aziende si rivolgano alle agenzie e che le agenzie sostituiscano i dipendenti o automatizzino l’automazione del flusso di lavoro non è valida oggi”, ha affermato. “Il dispositivo non c’è.”

Andando oltre gli intermediari ci sono strumenti di utilizzo del computer che possono occupare lo spazio di lavoro dell’utente per attività di base come la navigazione sul web. Ma questi sono ancora nella fase iniziale e, nonostante il crescente interesse, possono essere imprecisi, inaffidabili e persino pericolosi.

“Il problema è che i modelli di utilizzo del computer sono davvero pessimi in questo momento”, ha detto Masad. “Sono costosi, sono lenti, stanno facendo progressi, ma hanno solo un anno.”

Replit impara dall’errore commesso dal programmatore AI all’inizio di quest’anno l’intera base di codice di un’azienda in una corsa di prova. Masad ha ammesso: “Gli strumenti non erano abbastanza maturi” e ha affermato che da allora l’azienda aveva isolato lo sviluppo dalla produzione.

Ha osservato che tecniche come il test in-loop, l’esecuzione verificabile e l’isolamento dello sviluppo sono cruciali, sebbene possano richiedere un uso intensivo delle risorse. Replit ha incluso funzionalità in-loop nella versione 3 del suo agente e Masad ha affermato che il suo agente di prossima generazione può funzionare in modo autonomo per 200 minuti; alcuni lo hanno eseguito per 20 ore.

Tuttavia, ha riconosciuto che gli utenti erano frustrati dalla latenza. Quando emettono un “avvertimento grave” potrebbero dover attendere 20 minuti o più. Idealmente, avrebbero espresso il desiderio di impegnarsi in un ciclo più creativo in cui avrebbero potuto inserire più suggerimenti, lavorare su più attività contemporaneamente e adattare il progetto mentre l’agente lavorava.

“Il modo per risolvere questo problema è il parallelismo, creando più cicli di agenti e facendoli lavorare su queste funzionalità indipendenti, consentendo allo stesso tempo di svolgere il lavoro creativo”, ha affermato.

Gli agenti hanno bisogno di un cambiamento culturale

Al di là della prospettiva tecnica, esiste una barriera culturale: gli agenti operano in modo probabilistico, ma le aziende tradizionali sono strutturate attorno a processi deterministici, ha osservato Mike Clark, direttore dello sviluppo prodotto di Google Cloud. Ciò crea uno squilibrio culturale e operativo poiché i Master entrano in gioco con strumenti, quadri normativi e processi completamente nuovi.

“Non sappiamo come pensare agli agenti”, ha detto Clark. “Non sappiamo come capire cosa possono fare gli agenti.”

Le aziende che riescono a farlo bene, ha osservato, sono guidate da processi dal basso verso l’alto: creazione di software e strumenti no-code e low-code in pipeline per le agenzie più grandi. Le implementazioni che hanno avuto successo finora hanno avuto un ambito ristretto, attentamente mirato e fortemente controllate.

“Se guardo al 2025 e alla promessa che sarà l’anno delle spie, questo è l’anno in cui molte persone passeranno alla prototipazione”, ha detto Clark. “Siamo ora nel mezzo di questa fase su vasta scala”.

Come si garantisce un mondo senza pascoli?

Un’altra sfida è la sicurezza degli agenti IA, che richiede il ripensamento dei processi tradizionali, ha osservato Clark.

I confini di sicurezza sono tracciati attorno a tutto, ma ciò non funziona quando gli agenti hanno bisogno di accedere a molte fonti diverse per prendere le decisioni migliori, ha affermato Clark.

“Questo cambia davvero i nostri modelli di sicurezza, cambia la nostra linea di base”, ha detto. “Che cosa significa il minimo privilegio in un mondo indifeso e senza pascoli?”

In definitiva, è necessario un ripensamento gestionale per l’intero settore e le organizzazioni devono adattarsi a un modello di minaccia basato sugli intermediari.

Clark ha notato la disuguaglianza: “Se guardi alcuni dei tuoi processi di gestione, rimarrai stupito che l’origine di questi processi sia che qualcuno ha scritto tre copie su una macchina da scrivere elettrica IBM e l’ha data a tre persone. Non è questo il mondo in cui viviamo oggi.”

Collegamento alla fonte