I sistemi dei broker e la ricerca aziendale dipendono da una potente acquisizione di dati che funzioni in modo efficiente e accurato. Il fornitore di database MongoDB sta prendendo in considerazione l’ultima novità modelli da incasso Contribuisci a risolvere il calo della qualità dell’accesso man mano che sempre più sistemi di intelligenza artificiale entrano in produzione.
Man mano che i sistemi ad agenti e RAG entrano in produzione, la qualità dell’accesso emerge come un punto di fallimento silenzioso; un punto che può minare l’accuratezza, i costi e la fiducia dell’utente anche se i modelli stessi funzionano bene.
L’azienda ha rilasciato quattro nuove versioni dei suoi modelli di attracco e riordino. Voyage 4 sarà disponibile in quattro modalità: Voyage-4 Docking, Voyage-4-large, Voyage-4-lite e Voyage-4-nano.
MongoDB ha affermato che il dispiegamento del viaggio-4 funge da modello generale; MongoDB considera Voyage-4-large come il suo modello di punta. Voyage-4-lite si concentra su attività che richiedono poca latenza e costi inferiori, mentre Voyage-4-nano è progettato per ambienti di test e sviluppo più locali o per l’acquisizione di dati sul dispositivo.
Voyage-4-nano è anche il primo modello a peso aperto di MongoDB. Tutti i modelli sono disponibili tramite API e sulla piattaforma Atlas di MongoDB.
La società ha affermato che i modelli hanno sovraperformato modelli simili di Google e Cohere nel benchmark RTEB. Volto che abbraccia Confronto RTEB Mostra Voyage 4 come il modello di attracco principale.
“Il posizionamento dei modelli è una di quelle scelte invisibili che possono davvero creare o distruggere le esperienze di intelligenza artificiale”, ha affermato Frank Liu, product manager di MongoDB, in un briefing. “Se sbagli, i risultati della tua ricerca appariranno piuttosto casuali e superficiali, ma se sbagli, la tua app improvvisamente sembrerà di comprendere i tuoi utenti e i tuoi dati.”
Ha aggiunto che l’obiettivo dei modelli Voyage 4 è migliorare l’acquisizione dei dati del mondo reale, che spesso si blocca quando le pipeline di agenti e RAG entrano in produzione.
MongoDB ha anche rilasciato Voyage-multimodal-3.5, un nuovo modello di incorporamento multimodale in grado di gestire documenti contenenti testo, immagini e video. Questo modello vettorizza i dati ed estrae significato semantico da tabelle, grafici, figure e diapositive spesso presenti nei documenti aziendali.
Problemi di posizionamento dell’organizzazione
Per le aziende, un sistema rappresentativo è valido tanto quanto la sua capacità di recuperare in modo affidabile le informazioni giuste al momento giusto. Questo requisito diventa più difficile man mano che la scalabilità del carico di lavoro e le finestre di contesto diventano frammentate.
Diversi fornitori di modelli prendono di mira questo livello di intelligenza artificiale dell’agenzia. Quello di Google Al top si colloca il modello Gemini Recessed piazzato le classifiche e Cohere, Incorpora 4 modelli multimodaliElaborazione di documenti più lunghi di 200 pagine. Mistral ha detto del modello di coding-embedding: Incorporamento codestraleCohere supera Google e persino Voyage Code 3 di MongoDB. MongoDB sostiene che le prestazioni dei benchmark da sole non risolvono la complessità operativa che le aziende devono affrontare nella produzione.
MongoDB ha affermato che molti clienti hanno scoperto che i loro stack di dati non sono in grado di gestire carichi di lavoro sensibili al contesto e ad alta intensità di accesso in produzione. La società ha affermato che le aziende stanno assistendo a una maggiore frammentazione poiché devono riunire soluzioni disparate per connettere i database con un modello di annullamento o riordino. Per aiutare i clienti che non desiderano soluzioni frammentate, l’azienda offre i suoi modelli tramite Atlas, un’unica piattaforma dati.
L’argomentazione di MongoDB è che il recupero non può più essere trattato come una raccolta sciolta di componenti di prima qualità. Affinché gli agenti aziendali possano operare in modo affidabile su larga scala, le distribuzioni, il riordino e la stratificazione dei dati devono funzionare come un sistema strettamente integrato anziché come uno stack messo insieme.















