L’intelligenza artificiale aziendale ha un problema con i dati. Nonostante miliardi di dollari di investimenti e modelli linguistici sempre più efficaci, la maggior parte delle organizzazioni non è ancora in grado di rispondere a domande analitiche di base sui propri archivi di documenti. La colpa è dell’architettura, non della qualità del modello: tradizionale generazione aumentata di recupero (RAG) i sistemi sono progettati per recuperare e riassumere grandi quantità di documenti, non per analizzarli e raccoglierli.

Snowflake sta superando questa limitazione con una strategia di piattaforma completa annunciata alla conferenza BUILD 2025. L’azienda ha introdotto Snowflake Intelligence, una piattaforma di intermediazione di intelligence aziendale progettata per combinare analisi di dati strutturati e non strutturati e miglioramenti dell’infrastruttura che includono l’integrazione dei dati. flusso apertofusione del database Postgres del fiocco di neve e analisi in tempo reale con grafici interattivi. Obiettivo: eliminare i silos di dati e i colli di bottiglia architettonici che impediscono alle aziende di rendere operativa l’intelligenza artificiale su larga scala.

Un’innovazione chiave è Agentic Document Analytics, una nuova funzionalità di Snowflake Intelligence in grado di analizzare migliaia di documenti contemporaneamente. Ciò distrae le aziende da ricerche essenziali come: "Qual è la nostra politica di reimpostazione della password?" query analitiche complesse come "Mostra il numero di menzioni settimanali per area di prodotto nei miei ticket di assistenza clienti negli ultimi sei mesi."

Collo di bottiglia RAG: perché il campionamento per l’analisi fallisce?

I sistemi RAG tradizionali funzionano incorporando documenti in rappresentazioni vettoriali, memorizzandoli in un database vettoriale e recuperando i documenti semanticamente più simili quando l’utente pone una domanda.

"Affinché RAG funzioni, tutte le risposte che stai cercando devono essere disponibili in forma pubblicata oggi." Jeff Hollan, presidente di Cortex AI Agents presso Snowflake, ha spiegato a VentureBeat in una conferenza stampa. "Il modello a cui penso per RAG è come quello del bibliotecario, ricevi una domanda e ti dice: “Questo libro ha la risposta in questa pagina”."

Tuttavia, quando le organizzazioni devono eseguire analisi aggregate, questa architettura si rompe radicalmente. Ad esempio, se un’organizzazione dispone di 100.000 report e desidera identificare tutti i report che parlano di una particolare entità aziendale e riassumere tutte le entrate discusse in tali report, si tratta di un compito banale.

"Questo è qualcosa di molto più complesso del RAG tradizionale." disse l’Olanda.

Questa limitazione ha spesso costretto le aziende a mantenere pipeline di analisi separate per i dati strutturati nei data warehouse e per i dati non strutturati nei database vettoriali o negli archivi documenti. Il risultato sono silos di dati e sfide di governance per le aziende.

In che modo Agentic Document Analytics funziona diversamente?

L’approccio di Snowflake combina l’analisi dei dati strutturati e non strutturati nella sua piattaforma trattando i documenti come fonti di dati interrogabili piuttosto che come obiettivi di accesso. Il sistema utilizza l’intelligenza artificiale per estrarre, strutturare e indicizzare il contenuto dei documenti in modo da consentire operazioni analitiche simili a SQL su migliaia di documenti.

Questa funzionalità sfrutta l’architettura esistente di Snowflake. Cortex AISQL gestisce l’analisi e l’estrazione dei documenti. Le tabelle e gli archivi interattivi offrono prestazioni di query inferiori al secondo su set di dati di grandi dimensioni. Elaborando i documenti nella stessa piattaforma dati gestita che ospita i dati strutturati, le organizzazioni possono combinare le informazioni approfondite sui documenti con i dati delle transazioni, i record dei clienti e altre informazioni aziendali.

"Il valore e la potenza dell’intelligenza artificiale, la produttività e il potenziale dirompente dell’intelligenza artificiale vengono creati e abilitati connettendosi ai dati aziendali." Christian Kleinerman, vicepresidente del prodotto di Snowflake, ha dichiarato:

L’architettura dell’azienda affronta i problemi di governance che hanno rallentato l’adozione dell’intelligenza artificiale aziendale mantenendo tutte le transazioni di dati entro i limiti di sicurezza. Il sistema funziona con documenti provenienti da più fonti. Questi includono PDF di SharePoint, conversazioni Slack, dati di Microsoft Teams e record di Salesforce attraverso le funzionalità di integrazione zero-copy di Snowflake. Ciò elimina la necessità di estrarre e spostare i dati in sistemi di elaborazione AI separati.

Confronto con gli attuali approcci di mercato

L’annuncio posiziona Snowflake in modo diverso sia dai tradizionali fornitori di data warehouse che dalle startup basate sull’intelligenza artificiale.

Aziende come Databricks si sono concentrate sull’introduzione delle funzionalità di intelligenza artificiale nelle case sul lago, ma spesso si affidano ancora a database vettoriali e modelli RAG tradizionali per i dati non strutturati. L’API Assistants di OpenAI e Claude di Anthropic offrono l’analisi dei documenti, ma sono limitati dalle dimensioni della finestra di contesto.

I fornitori di database vettoriali come Pinecone e Weaviate hanno costruito la propria attività attorno a casi d’uso RAG, ma a volte si trovano ad affrontare sfide quando i clienti necessitano di query analitiche anziché di query basate sull’accesso. Questi sistemi sono efficaci nel trovare documenti rilevanti, ma non possono facilmente aggregare informazioni su grandi insiemi di documenti.

I principali casi d’uso di alto valore evidenziati da Snowflow per il suo approccio, precedentemente sfuggenti nelle architetture solo RAG, includono l’analisi dell’assistenza clienti. Invece di rivedere manualmente i ticket di supporto, le organizzazioni possono interrogare i modelli attraverso migliaia di interazioni. Domande come "Quali sono i 10 principali problemi dei prodotti menzionati nei ticket di supporto di questo trimestre per segmento di clientela?" Diventa responsabile in pochi secondi.

Cosa significa questo per la strategia AI aziendale?

Agentic Document Analytics per organizzazioni che sviluppano strategie di intelligenza artificiale "cercare e recuperare" Paradigma RAG "interrogarsi e analizzare" Il paradigma è più familiare degli strumenti di business intelligence.

Invece di creare database vettoriali e sistemi RAG separati per ciascun caso d’uso, le aziende possono consolidare l’analisi dei documenti su piattaforme dati esistenti. Ciò riduce la complessità dell’infrastruttura estendendo al tempo stesso le applicazioni di business intelligence ai dati non strutturati.

Questa capacità democratizza anche l’accesso. Rendere interrogabile l’analisi dei documenti attraverso il linguaggio naturale significa che i team di data science precedentemente richiesti metteranno a disposizione degli utenti aziendali informazioni approfondite.

Per le organizzazioni che desiderano essere leader nel campo dell’intelligenza artificiale, il vantaggio competitivo non deriva dall’avere modelli linguistici migliori, ma dall’analisi dei dati aziendali strutturati e dei dati non strutturati personalizzati su larga scala. Le organizzazioni che possono interrogare intere strutture di documenti con la stessa facilità con cui interrogano i data warehouse otterranno informazioni che i concorrenti non possono replicare facilmente.

"L’intelligenza artificiale oggi è una realtà" Kleinerman ha detto: "Molte organizzazioni già traggono valore dall’intelligenza artificiale e, se qualcuno sta ancora aspettando o è seduto in disparte, il nostro invito all’azione è iniziare a costruire ora."

Collegamento alla fonte