Vorresti più informazioni intelligenti nella tua scatola in arrivo? Iscriviti solo alle nostre newsletter settimanali per ottenere la cosa importante per l’intelligenza artificiale aziendale, i dati e i leader della sicurezza. Iscriviti ora


Ricercatori di Google sviluppato Il nuovo telaio per agenti di ricerca AI che funzionano meglio di Openi, stupore e sistemi di guida rivale da altri In criteri chiave.

Nuovo agente, Diffusione del test del tempo ricercatore profondo (TTD-DR) è ispirato dal modo di scrivere facendo in modo che le persone preparano una bozza, cercano informazioni e revisioni ripetitive.

Il sistema utilizza meccanismi di diffusione e algoritmi evolutivi per condurre ricerche più complete e accurate su questioni complesse.

Questo frame per le aziende La nuova generazione compensata per attività alte -vabili può dare forza agli assistenti di ricerca Questi sistemi standard di produzione aumentata di acquisto (RAG) stanno lottando come creare un’analisi competitiva o un rapporto di accesso al mercato.


Ai Stroops sui limiti di ridimensionamento

I limiti di potenza, l’aumento dei costi dei marcatori e le inferenze ritardi rimodellano AI aziendale. Unisciti alla nostra sala privata per scoprire come sono le migliori squadre:

  • Trasformare l’energia in un vantaggio strategico
  • Architetto efficiente deduzione per guadagni di resa reale
  • Aprire lo sblocco di un rendimento degli investimenti competitivi con sistemi AI sostenibili

Assicurati il tuo posto dove stare in futuro: https://bit.ly/4mwgngo


Secondo gli autori dell’articolo, questo vero mondo di uso aziendale era l’obiettivo principale per il sistema.

I limiti degli agenti di ricerca profondi esistenti

Gli agenti di ricerca profonda (DR) sono progettati per far fronte a query complesse che vanno oltre una semplice ricerca. Usano i modelli di grandi dimensioni (LLM) per pianificare, utilizzare strumenti come la ricerca Web per raccogliere informazioni e quindi sintetizzare in un rapporto dettagliato con tecniche di ridimensionamento del tempo come la catena di pensiero (COT), Numbling N-numbl e Monte-Carlo.

Tuttavia, la maggior parte di questi sistemi ha limiti di progettazione di base. La maggior parte degli agenti DR, che sono aperti a tutti, applicano algoritmi e strumenti senza tempo di test senza una struttura che riflette il comportamento cognitivo umano. Gli agenti open source di solito seguono un solido processo lineare o parallelo nella pianificazione, ricerca e produzione dei contenuti, Rende difficile per le diverse fasi della ricerca interagire e correggere a vicenda.

Esempio rappresentativo di ricerca lineare Fonte: arxiv

Ciò può far perdere all’agente il contesto globale della ricerca e perdere le connessioni critiche tra diverse informazioni.

“Ciò dimostra una limitazione di base nel lavoro dell’attuale agente DR e sottolinea che è necessario un quadro più armonioso e mirato per gli agenti del DR che imitano o superano le capacità di ricerca umana.”

Un nuovo approccio ispirato alla scrittura e alla diffusione umana

A differenza del processo lineare della maggior parte degli agenti di intelligenza artificiale, i ricercatori umani lavorano in modo ripetitivo.. Di solito a Crea un piano superiore, crea una prima bozza e quindi unisciti a più cicli di revisione. Durante queste revisioni, cercano nuove informazioni per rafforzare le loro argomentazioni e colmare le lacune.

I ricercatori di Google hanno osservato questo Il processo umano può essere imitato usando un modello di diffusione È aumentato con un componente di recupero. (I modelli di diffusione vengono spesso utilizzati nella produzione di immagini. Iniziano con un’immagine rumorosa e li perfezionano lentamente fino a diventare un’immagine dettagliata.)

Come hanno spiegato i ricercatori, “In questa analogia, un modello di diffusione addestrato inizialmente produce una bozza rumorosa e il modulo di denoising, che supporta gli strumenti di recupero, trasforma questa bozza in output più di qualità (o più alta risoluzione)”.

TTD-DR è stato costruito su questo piano. Il framework è considerato come un processo di processo di diffusione in cui viene creato un rapporto di ricerca, in cui un primo “Draft Ç rumorosi viene gradualmente convertito in un rapporto finale raffinato.

TTD-DR utilizza un approccio ricorrente per migliorare la fonte del primo piano di ricerca: arxiv

Si ottengono questi due meccanismi di base. Il primo, che i ricercatori lo chiamano Deno, inizia con una bozza preliminare e sviluppa ripetute. Ad ogni passaggio, l’agente integra la bozza esistente come “denoise iyle formulando nuove query di ricerca, ricevendo informazioni esterne e correggendo gli errori e aggiungendo dettagli.

Il secondo meccanismo, “autoevrim”, consente a ciascun componente dell’agente (pianificatore, generatore di domande e sintesi di risposta) di ottimizzare le proprie prestazioni in modo indipendente. Nei commenti fatti a VentureBeat, Rujun Han, un ricercatore su Google e l’autentore dell’articolo, ha spiegato che l’evoluzione è molto importante a questo livello di componenti perché “rende il rapporto più efficace”. Questo è simile a un processo evolutivo in cui ogni parte del sistema è sempre più migliore nel proprio compito e fornisce un contesto di qualità superiore per il processo di revisione principale.

Ognuno dei componenti in TTD-DR utilizza algoritmi evolutivi per campionare e sensibilizzare la risposta multipla in parallelo e infine combinarli: arxiv: arxiv

“La complessa interazione e la combinazione sinergica di questi due algoritmi sono molto importanti per ottenere risultati di ricerca di alta qualità, Saz afferma che gli autori. Questo processo di ripetizione risulta solo più accurati, ma anche rapporti più logicamente coerenti. Come sottolinea Han, il modello è una misura diretta della capacità di produrre documenti aziendali ben conduttiti con documenti aziendali ben conduttiti con documenti commerciali ben strutturati, al momento della valutazione della fluidità.

Secondo l’articolo, L’amico della ricerca risultante ha dichiarato: “Può creare rapporti utili e completi per complesse domande di ricerca in varie aree industriali, Finanza, biomedica, ricreazione e tecnologia “, ha affermato.

Azione TTD-DR

I ricercatori hanno utilizzato il kit di sviluppo degli agenti di Google (ADK) per creare e testare i loro frame e hanno utilizzato una piattaforma con Geminin 2.5 Pro con Gemini 2.5 Pro (puoi cambiarlo per altri modelli) come Core LLM.

Hanno confrontato TTD-D con i principali sistemi commerciali e open source come Openai Deep Research, Deep Research, Gok DeepSearch e Open Source. -Ricerca GPT.

La valutazione si concentra su due aree principali. Per creare rapporti completi a forma di lungo Benchmark DeepConsultOltre ai propri cluster di dati di ricerca a lungo termine, una raccolta di informazioni di lavoro e consulenza. Hanno testato l’agente a sfidare i criteri accademici e reali per rispondere a domande molto veloci che richiedono ricerche e ragionamenti completi. L’esame finale dell’umanità (Hle) e Gaia.

I risultati hanno mostrato che il TTD-D funziona continuamente meglio dei suoi concorrenti. Nel confronto tra le ricerche profonde di Openai sulla produzione di report a forma lunga, TTD-DR, 69,1% e utili del 74,5% in due diversi cluster di dati. Inoltre, il sistema di Openi, con guadagni di prestazioni del 4,8%, 7,7%e 1,7%, ha superato tre criteri separati che richiedono un ragionamento molto rapido per trovare risposte brevi.

TTD-D, rebrancing da altri agenti di ricerca profondi nei confronti chiave: arxiv

Il futuro della diffusione del tempo di prova

La ricerca attuale è progettata per concentrarsi su report basati sul testo utilizzando la ricerca Web, mentre il frame è progettato per essere altamente adattabile. Han ha confermato che il team prevede di espandere il business per includere più veicoli per compiti aziendali complessi.

UN Il processo simile a “test-time diffusion” può essere utilizzato per creare un codice software complessoCrea un modello finanziario dettagliatoO Progetta una campagna di marketing multi -stageLa prima “bozza” del progetto Ripetutamente raffinato con nuove informazioni E feedback da vari veicoli speciali.

“Tutti questi strumenti possono essere naturalmente inclusi nel nostro framework, ha affermato Han Han, questo approccio centrale da bozza può essere un’architettura di base per un’ampia varietà di agenti di intelligenza artificiale complessi e multiple.


Collegamento alla fonte