Nell’ultimo anno, la comunità dell’intelligenza artificiale aziendale è stata coinvolta in un dibattito su quanta libertà concedere agli agenti di intelligenza artificiale. Troppo poco e ti ritroverai con una costosa automazione del flusso di lavoro che copre a malapena i costi. "agente" biglietto. Se fai troppo, dovrai affrontare il tipo di disastri legati alla cancellazione dei dati che hanno afflitto i primi ad adottare strumenti come OpenClaw. Questa settimana Google Labs ha rilasciato un aggiornamento. Opaleil costruttore di agenti visivi senza codice arriva silenziosamente a una risposta e porta lezioni che ogni leader IT che pianifica una strategia per agenti dovrebbe studiare attentamente.

L’aggiornamento introduce ciò che Google chiama "passo dell’agente" Una funzionalità che trasforma i flussi di lavoro drag-and-drop precedentemente statici di Opal in esperienze dinamiche e interattive. Invece di determinare manualmente quale modello o veicolo evocare e in quale ordine, i costruttori possono ora definire un obiettivo e lasciare che sia l’agente a determinare il percorso migliore per raggiungerlo; può selezionare strumenti, attivare modelli come Gemini 3 Flash o Veo per creare video e persino avviare chat con gli utenti quando hanno bisogno di maggiori informazioni.

Sembra un modesto aggiornamento del prodotto. Non. Ciò che Google offre è un’architettura di riferimento funzionante per tre funzionalità che definiranno gli agenti aziendali nel 2026:

  1. Routing adattivo

  2. memoria permanente

  3. Orchestrazione umana nel loop

…e tutto questo è possibile grazie alle capacità di ragionamento in rapida evoluzione di modelli pionieristici come la serie Gemini 3.

Il punto di svolta “scomodo”: perché modelli migliori stanno cambiando tutto ciò che riguarda la progettazione delle rappresentazioni

Per capire perché l’aggiornamento Opal è importante, è necessario comprendere un cambiamento nell’ecosistema degli agenti che si sta producendo da mesi.

La prima ondata di strutture per agenti aziendali, costituita da strumenti come le prime versioni di CrewAI e le prime versioni di LangGraph, erano definite dalla tensione tra autonomia e controllo. I primi modelli non erano abbastanza affidabili da poter essere utilizzati per prendere decisioni a tempo indeterminato. Il risultato è ciò che i praticanti hanno iniziato a cercare "agenti sui binari": flussi di lavoro strettamente vincolati in cui ogni punto decisionale, ogni chiamata allo strumento e ogni percorso di diramazione devono essere predefiniti da uno sviluppatore umano.

Questo approccio ha funzionato ma era limitato. Costruire un agente su rotaie significava anticipare ogni possibile situazione che il sistema avrebbe potuto incontrare; un incubo combinatorio per qualsiasi cosa oltre i compiti semplici e lineari. Quel che è peggio, significava che gli agenti non erano in grado di adattarsi alle nuove situazioni; Questa è stata la capacità che ha reso preziosa l’intelligenza artificiale dell’agenzia in primo luogo.

La serie Gemini 3, insieme alle recenti versioni di Anthropic come Claude Opus 4.6 e Sonnet 4.6, rappresentano una soglia in cui i modelli diventano così affidabili nella pianificazione, nel ragionamento e nell’autocorrezione da poter iniziare a uscire dai binari. L’aggiornamento Opal di Google è un riconoscimento di questo cambiamento. Il passaggio del nuovo agente non richiede ai builder di predefinire ogni percorso in un flusso di lavoro. Si basa invece sul modello sottostante per valutare l’obiettivo dell’utente, valutare gli strumenti disponibili e determinare dinamicamente la sequenza ottimale di azioni.

Questo è lo stesso modello che rende fattibili i flussi di lavoro degli agenti e le chiamate agli strumenti di Claude Code: i modelli sono sufficientemente buoni da consentire all’agente di decidere cosa fare dopo e spesso si autocorregge senza che un essere umano debba richiedere nuovamente manualmente ogni errore. La differenza rispetto a Claude Code è che Google ora racchiude questa funzionalità in un prodotto di livello consumer e privo di codice; Questo è un forte segnale che la tecnologia sottostante ha superato la fase sperimentale.

Per i team aziendali, l’implicazione è semplice: se stai ancora progettando architetture di agenti che richiedono percorsi predefiniti per ogni contingenza, probabilmente stai esagerando. I modelli di prossima generazione supportano un modello di progettazione in cui si definiscono obiettivi e vincoli, si forniscono strumenti e si lascia che il modello gestisca il routing (passando dalla pianificazione degli agenti alla loro gestione).

Memoria delle sessioni incrociate: cosa differenzia le demo dagli agenti di produzione

La seconda grande aggiunta nell’aggiornamento Opal è la memoria persistente. Google ora consente a Opals di ricordare le informazioni tra le sessioni (preferenze dell’utente, interazioni precedenti, contesto accumulato), creando agenti che migliorano con l’uso anziché ricominciare da zero ogni volta.

Google non ha rivelato l’implementazione tecnica dietro il sistema di memoria di Opal. Ma questo modello stesso è ben radicato nella comunità rappresentativa. Strumenti come OpenClaw gestiscono la memoria principalmente tramite markup e file JSON; Questo è un approccio semplice che funziona su sistemi a utente singolo. Le distribuzioni aziendali si trovano ad affrontare un problema più difficile: proteggere la memoria tra più utenti, sessioni e confini di sicurezza senza che tra di essi si diffonda un contesto sensibile.

Questa distinzione tra memoria per utente singolo e memoria multiutente è una delle sfide meno discusse nell’implementazione degli agenti aziendali. Un assistente di codifica personale che ricorda la struttura del progetto è fondamentalmente diverso da un agente a contatto con il cliente che deve mantenere stati di memoria separati per migliaia di utenti simultanei rispettando le policy di conservazione dei dati.

Il segnale dell’aggiornamento Opal è che Google considera la memoria una caratteristica fondamentale dell’architettura dell’agente, non un componente aggiuntivo opzionale. Per i decisori IT che valutano le piattaforme di agenti, ciò dovrebbe informare i loro criteri di acquisto. Un framework di agenti senza una chiara strategia di memoria è quello che produrrà demo impressionanti ma dovrà affrontare sfide nella produzione, dove il valore di un agente è aggravato da interazioni ripetute con gli stessi utenti e set di dati.

Man in the loop è un modello di progettazione, non un ripiego

La terza tappa dell’aggiornamento Opal è ciò che Google chiama "chat interattiva" — La capacità di un agente di sospendere l’esecuzione, porre all’utente una domanda di follow-up, raccogliere informazioni mancanti o presentare opzioni prima di continuare. Nella terminologia dell’architettura degli agenti, questa è l’orchestrazione dell’essere umano nel ciclo e la sua inclusione in un prodotto di consumo la dice lunga.

Gli agenti più influenti nella produzione oggi non sono completamente autonomi. Si tratta di sistemi che sanno quando hanno raggiunto i limiti della loro fiducia e possono restituire con grazia il controllo a un essere umano. Questo è il modello che distingue gli intermediari aziendali fidati dai sistemi autonomi in fuga che creano storie di avvertimento nel settore.

In framework come LangGraph, l’human-in-the-loop è stato tradizionalmente implementato come un nodo esplicito nel grafico; si tratta di un checkpoint codificato in cui l’esecuzione viene sospesa per la revisione umana. L’approccio di Opal è più fluido: è l’agente stesso a decidere quando necessita dell’input umano in base alla qualità e alla completezza delle informazioni in suo possesso. Si tratta di un modello di interazione più naturale e che si adatta meglio perché non richiede al costruttore di prevedere esattamente dove sarà necessario l’intervento umano.

La lezione per gli architetti aziendali è che l’essere umano nel ciclo non dovrebbe essere trattato come una rete di sicurezza che viene avvitata solo dopo la creazione dell’agente. Questa dovrebbe essere una funzionalità di prima classe del framework dell’agente; una capacità che il modello può invocare dinamicamente in base alla propria valutazione dell’incertezza.

Routing dinamico: lascia che sia il modello a decidere il percorso

L’ultima caratteristica importante è il routing dinamico, in cui i costruttori possono definire più percorsi attraverso un flusso di lavoro e consentire all’agente di scegliere quello appropriato in base a criteri personalizzati. L’esempio di Google è un rappresentante del briefing esecutivo che prende percorsi diversi a seconda che l’utente stia incontrando un cliente nuovo o esistente; in un caso cerca sul web informazioni di base, nell’altro caso esamina gli appunti delle riunioni interne.

Questo è concettualmente simile al branching condizionale, che LangGraph e framework simili supportano da tempo. Tuttavia, l’implementazione di Opal riduce significativamente la barriera consentendo agli sviluppatori di definire i criteri di routing in linguaggio naturale anziché in codice. Il modello interpreta i criteri e prende la decisione di routing anziché richiedere allo sviluppatore di scrivere una logica condizionale esplicita.

Il risvolto istituzionale è importante. Il routing dinamico basato su criteri del linguaggio naturale consente agli analisti aziendali e agli esperti di dominio, non solo agli sviluppatori, di identificare il comportamento complesso degli agenti. Ciò sposta lo sviluppo degli agenti da una disciplina puramente ingegneristica a una in cui la conoscenza del dominio diventa il collo di bottiglia principale; Si tratta di un cambiamento che potrebbe accelerare significativamente l’adozione nelle business unit non tecniche.

Ciò che Google sta realmente costruendo: uno strato di intelligence intermedio

Andando oltre le singole funzionalità, lo schema più ampio nell’aggiornamento Opal è che Google sta creando uno strato di intelligenza che si colloca tra l’intento dell’utente e l’esecuzione di attività complesse in più passaggi. Basato sulle lezioni apprese dal suo strumento interno SDK.Tagliere per il pane“, la fase agente non è solo un altro nodo nel flusso di lavoro; livello di orchestrazione in grado di reclutare modelli, evocare veicoli, manipolare la memoria, manipolare dinamicamente e interagire con gli umani, il tutto guidato dalle capacità di ragionamento in continua evoluzione dei modelli Core Gemini.

Questo è lo stesso modello architettonico emergente nel settore. Claude Code di Anthropic, con la sua capacità di gestire autonomamente le attività di codifica durante la notte, si basa su principi simili: un modello capace, accesso a strumenti, contesto persistente e cicli di feedback che consentono l’autocorrezione. L’aggiunta di Ralph Wiggum ha formalizzato l’idea secondo cui i modelli possono essere spinti ad arrivare a soluzioni corrette di fronte ai propri fallimenti; È una versione di autocorrezione basata sulla forza bruta, con Opal che ora racchiude parte di questo in un’esperienza di consumo raffinata.

Il vantaggio per i team aziendali è che l’architettura degli agenti converge su un insieme comune di elementi fondamentali: pianificazione mirata agli obiettivi, utilizzo degli strumenti, memoria persistente, routing dinamico e orchestrazione human-in-the-loop. L’elemento di differenziazione non sarà quali primitive implementerai, ma quanto bene le integrerai e quanto efficacemente sfrutterai le capacità in evoluzione dei modelli edge per ridurre la quantità di configurazione manuale richiesta.

Manuale pratico per i creatori di agenti aziendali

Offrendo queste funzionalità in un prodotto gratuito rivolto al consumatore, Google invia un messaggio chiaro: i modelli di base per la creazione di agenti IA efficaci non sono più ricerche all’avanguardia. È stato prodotto. I team aziendali in attesa che la tecnologia maturi ora hanno un’applicazione di riferimento che possono rivedere, testare e da cui imparare a costo zero.

I passaggi pratici sono semplici. Innanzitutto, valuta se le tue attuali architetture di broker sono eccessivamente limitate. Se ogni punto decisionale richiede una logica codificata, probabilmente non stai sfruttando le capacità di pianificazione dei modelli di frontiera esistenti. In secondo luogo, dare priorità alla memoria come componente architetturale principale, non come ripensamento. In terzo luogo, invece di un punto di controllo fisso nel flusso di lavoro, progettare l’essere umano nel ciclo come una capacità dinamica a cui l’agente può fare appello. In quarto luogo, esplorare il routing del linguaggio naturale come un modo per coinvolgere esperti di dominio nel processo di progettazione dell’agente.

Opal stesso probabilmente non sarà la piattaforma adottata dalle aziende. Ma i modelli di progettazione che contiene – agenti adattivi, ricchi di memoria e consapevoli dell’uomo supportati da modelli edge – sono i modelli che definiranno la prossima generazione di IA aziendale. Google ha mostrato le sue carte. La domanda per i leader IT è se prestano attenzione.

Collegamento alla fonte