Man mano che emergono sempre più opzioni per orchestrare sistemi multi-agente complessi, l’era delle aziende che combinano catene di richieste e intermediari ombra sta volgendo al termine. Mentre le organizzazioni mettono in produzione gli agenti IA, la domanda rimane: "Come li gestiremo?"

Google e Amazon Web Services offrono risposte fondamentalmente diverse, illustrando il divario nello stack dell’intelligenza artificiale. Mentre l’approccio di Google consiste nell’eseguire una gestione mediata a livello di sistema, il metodo di sfruttamento di AWS è impostato a livello di esecuzione.

Il dibattito su come gestire e controllare ha guadagnato nuova energia nell’ultimo mese quando le aziende rivali hanno rilasciato o aggiornato le loro piattaforme di creazione di agenti (i nuovi Claude Managed Agents e Anthropic con OpenAI). SDK degli agenti—offre ai team di sviluppatori opzioni per gestire gli agenti.

Nuove funzionalità aggiunte ad AWS Bedrock AgentCore Continua a offrire la gestione dell’identità e dei veicoli ottimizzando la velocità facendo affidamento sull’hardware per portare gli agenti al prodotto più rapidamente.

Nel frattempo, Gemini Enterprise di Google Adotta un approccio incentrato sulla gestione utilizzando un piano di controllo in stile Kubernetes. Ciascun metodo offre uno sguardo su come gli agenti passano da aiutanti di attività a breve termine a risorse a lungo termine all’interno di un flusso di lavoro.

Aggiornamenti e ombrelli

Per capire la posizione di ciascuna azienda, ecco le novità concrete.

Google ha rilasciato una nuova versione di Gemini Enterprise, riunendo sotto lo stesso tetto le sue offerte di agenti AI aziendali (Gemini Enterprise Platform e Gemini Enterprise Application).

L’azienda è stata rinominata Vertex AI come piattaforma aziendale Geminima insiste che l’interfaccia è fondamentalmente la stessa, a parte il cambio di nome e le nuove funzionalità.

“Vogliamo fornire una piattaforma e una porta d’ingresso affinché le aziende possano accedere a tutti i sistemi e gli strumenti di intelligenza artificiale forniti da Google”, ha dichiarato a VentureBeat Maryam Gholami, direttore senior della gestione dei prodotti presso Gemini Enterprise. “Pensiamola in questo modo: l’app Gemini Enterprise è basata sulla piattaforma Gemini Enterprise Broker e tutti gli strumenti di sicurezza e governance sono disponibili gratuitamente come parte dell’abbonamento all’app Gemini Enterprise.”

D’altra parte, AWS aggiunge nuovo hardware per agenti gestiti a Bedrock Agentcore. In un comunicato stampa condiviso con VentureBeat, la società ha affermato che l’hardware “invece di essere preinstallato, ottiene un punto di partenza basato sulla configurazione alimentato da Strands Agents, il framework di agenti open source di AWS”.

Gli utenti definiscono cosa fa l’agente, il modello che utilizza e gli strumenti che chiama e AgentCore fa il lavoro di riunire tutto per eseguire l’agente.

Gli intermediari stanno diventando sistemi

Il passaggio verso agenti autonomi con stato e di lunga durata ci ha costretto a ripensare al comportamento dei sistemi di intelligenza artificiale. Mentre gli agenti passano da compiti di breve durata a flussi di lavoro di lunga durata, emerge una nuova classe di fallimenti: la deriva dello stato.

Mentre gli agenti continuano a lavorare, accumulano anche memoria di stato, risposte e contesto in evoluzione. Col passare del tempo, questa situazione perde la sua validità. Le fonti dei dati variano o gli strumenti possono fornire risposte contrastanti. Ma l’agente diventa più vulnerabile alle incoerenze e meno onesto.

L’affidabilità dell’agente diventa un problema di sistema e la gestione di questa deriva potrebbe richiedere qualcosa di più di un’implementazione più rapida; possono richiedere visibilità e controllo.

È questo punto di fallimento che piattaforme come Gemini Enterprise e AgentCore stanno cercando di prevenire.

Sebbene questo cambiamento sia già in atto, Gholami ha ammesso che saranno i clienti a determinare come gestire e controllare qualsiasi agente di lunga data.

“Impareremo molto dai clienti che utilizzeranno agenti di lunga durata e assegneranno a quegli agenti autonomi un compito da portare avanti e svolgere”, ha affermato Gholami. “Ovviamente ci sono trucchi ed equilibri per farlo bene, e l’agente può tornare e chiedere ulteriori input.”

Nuovo stack IA

Diventa sempre più chiaro che lo stack dell’intelligenza artificiale è suddiviso in diversi livelli e risolve problemi diversi.

AWS, e in una certa misura Anthropic e OpenAI, vengono ottimizzati per una distribuzione più rapida. Mentre Claude Managed Agents elimina gran parte del lavoro di backend volto a mantenere un agente attivo e funzionante, Agents SDK ora include sandbox e supporto di cablaggio pronto all’uso. Questi approcci mirano a ridurre gli ostacoli alla messa in funzione degli agenti.

Google offre un pannello di controllo centrale per gestire l’identità, applicare le policy e monitorare il comportamento a lungo termine.

Le aziende probabilmente hanno bisogno di entrambi.

Alcuni professionisti affermano che le aziende devono avere un dialogo serio su quanti rischi sono disposti a correre.

“Il punto chiave per i leader tecnologici aziendali che attualmente stanno prendendo in considerazione queste tecnologie può essere formulato come segue: sebbene la questione dell’esecuzione e del runtime degli agenti sia spesso percepita come build and buy, è principalmente una questione di gestione del rischio. Se puoi permetterti di far funzionare i tuoi agenti attraverso un runtime di terze parti perché non influiscono sui flussi di entrate, va bene. Al contrario, nel contesto di processi più critici, la seconda opzione sarà l’unica opzione da considerare dal punto di vista del business,” ha affermato. EZContacts ha detto a VentureBeat in una e-mail.

L’iterazione rapida consente ai team di sperimentare ed esplorare cosa possono fare gli agenti, mentre il controllo centralizzato aggiunge un livello di fiducia. Ciò di cui le organizzazioni hanno bisogno è assicurarsi di non essere vincolate a sistemi progettati per eseguire gli agenti in un unico modo.

Collegamento alla fonte