Le aziende ora comprendono che la generazione aumentata di accesso (RAG) consente alle applicazioni e agli agenti di trovare le informazioni migliori e più fondate per le query. Tuttavia, le tipiche installazioni RAG possono essere impegnative dal punto di vista ingegneristico e presenta anche proprietà indesiderabili.

Per aiutare a risolvere questo problema, Google Rilasciato lo strumento di ricerca file su Gemini API, un sistema RAG completamente gestito. astratto pipeline di ripristino. File Search elimina gran parte degli strumenti e della raccolta di applicazioni coinvolti nella configurazione delle pipeline RAG, quindi gli ingegneri non hanno bisogno di assemblare elementi come soluzioni di archiviazione e distribuzione di creatori.

Questo strumento è in diretta concorrenza con i prodotti RAG aziendali. OpenAI, AWS E MicrosoftMira inoltre a semplificare l’architettura RAG. Ma Google sostiene che la sua offerta richiede meno regolamentazione ed è più indipendente.

“File Search fornisce un modo semplice, integrato e scalabile per connettere Gemini con i tuoi dati, fornendo risposte più accurate, pertinenti e verificabili”, ha affermato Google. un post sul blog.

Le organizzazioni possono accedere gratuitamente ad alcune delle funzionalità di File Search, come l’archiviazione e la creazione di posizionamenti, al momento della query. Gli utenti inizieranno a pagare per gli incorporamenti una volta che questi file saranno indicizzati a una tariffa fissa di 0,15 dollari per 1 milione di token.

Alla fine è diventato il modello Gemini Embedded di Google. modello a filo superiore Potenzia la ricerca di file nel benchmark di incorporamento di testo di massa.

Ricerca file ed esperienze integrate

Google ha affermato che File Search funziona “gestendo la complessità di RAG per te”.

Ricerca file gestisce l’archiviazione dei file, le strategie di frammentazione e i posizionamenti. Gli sviluppatori possono eseguire la ricerca di file all’interno dell’API CreateContent esistente, che secondo Google rende lo strumento più facile da adottare.

Ricerca file utilizza la ricerca vettoriale per “comprendere il significato e il contesto della query di un utente”. Idealmente, troverà informazioni rilevanti dai documenti per rispondere a una domanda, anche se il prompt contiene parole incomplete.

Questa funzionalità presenta virgolette integrate che puntano a sezioni specifiche del documento utilizzato per creare la risposta e supporta anche una varietà di formati di file. Questi includono PDF, Docx, txt, JSON e molti tipi di file di linguaggi di programmazione comuni," Google dice.

Saggio RAG continuo

Le aziende potrebbero iniziare a costruire una pipeline RAG mentre gettano le basi affinché gli agenti di intelligenza artificiale possano accedere effettivamente a dati accurati e prendere decisioni informate.

Poiché RAG rappresenta una parte fondamentale del modo in cui le organizzazioni mantengono l’accuratezza e sfruttano le informazioni approfondite nel proprio business, le organizzazioni devono ottenere rapidamente visibilità su questo canale. RAG può rappresentare una sfida ingegneristica perché organizzare più strumenti insieme può diventare complesso.

Costruire pipeline RAG “tradizionali” significa che le organizzazioni devono assemblare e mettere a punto un programma di inserimento e analisi dei file, inclusa la distruzione, la creazione di incorporamenti e gli aggiornamenti. Devono quindi contrattare un database vettoriale come questo: pignaSpecifica la logica di importazione e inserisci il tutto nella finestra di contesto di un modello. Inoltre, se lo si desidera, è possibile aggiungere citazioni della fonte.

Sebbene le piattaforme concorrenti offrano funzionalità simili, File Search mira a rendere tutto ciò più semplice. OpenAI API degli assistenti Consente agli sviluppatori di utilizzare una funzionalità di ricerca di file che indirizza un agente alla documentazione pertinente per le risposte. Presentato Bedrock di AWS servizio gestito di automazione dei dati A dicembre.

Sebbene File Search rimanga simile a queste altre piattaforme, l’offerta di Google elimina tutti gli elementi della creazione della pipeline RAG, non solo alcuni.

Phaser Studio, creatore della piattaforma di creazione di giochi basata sull’intelligenza artificiale Beam, ha dichiarato sul blog di Google di aver utilizzato File Search per scansionare la sua libreria di 3.000 file.

“La ricerca di file ci consente di far emergere immediatamente il materiale giusto, che si tratti di un frammento di codice per schemi di punti, modelli di tipo o linee guida architettoniche dal nostro corpus ‘cervello’ di Phaser”, ha affermato Richard Davey, CTO di Phaser. “Di conseguenza, le idee che una volta richiedevano giorni per essere prototipate ora sono realizzabili in pochi minuti.”

Dall’annuncio, molti utenti hanno espresso interesse nell’utilizzo di questa funzionalità.

Collegamento alla fonte