La rivoluzione del deep learning ha un interessante punto cieco: il foglio di calcolo. Mentre i Large Language Models (LLM) padroneggiano le sfumature della prosa umana e i generatori di immagini prendono il sopravvento sulla tela digitale, i dati strutturati e relazionali che sono alla base dell’economia globale – le righe e le colonne dei sistemi ERP, CRM e registri finanziari – sono stati fino ad ora trattati semplicemente come un altro formato di file simile al testo o ai PDF.

Ciò ha portato le aziende a prevedere i risultati aziendali utilizzando il tipico processo di data science personalizzato e ad alta intensità di lavoro di ingegneria delle funzionalità manuali e i classici algoritmi di machine learning che hanno preceduto il moderno deep learning.

Ma ora BaseUna società di intelligenza artificiale con sede a San Francisco co-fondata dai laureati di DeepMind Per colmare questa lacuna, oggi apriamo con un fondo totale di 255 milioni di dollari..

Uscendo dalla segretezza, l’azienda sta lanciando NEXUS, un Large Table Model (LTM) progettato per trattare i dati aziendali non come una semplice stringa di parole ma come una complessa rete di relazioni non lineari.

Tecnologia: andare oltre la logica sequenziale

La maggior parte degli attuali modelli di intelligenza artificiale si basano su una logica sequenziale, prevedendo la parola successiva in una frase o il pixel successivo in un fotogramma.

Ma i dati aziendali non sono intrinsecamente sequenziali. Il rischio di abbandono di un cliente non è solo una sequenza temporale; è un’intersezione multidimensionale tra frequenza delle transazioni, sentiment sui ticket di supporto e cambiamenti economici regionali. Gli attuali Master lottano con questo problema perché non si adattano bene ai vincoli di dimensioni e dimensionalità delle tabelle su scala aziendale.

"I dati più preziosi del mondo risiedono nelle tabelle e ad oggi non esiste un buon modello sottostante creato appositamente per comprenderli." Lo ha detto Jeremy Fraenkel, CEO e co-fondatore di Fundamental.

In una recente intervista con VentureBeat, Fraenkel ha sottolineato che, anche se il mondo dell’intelligenza artificiale è ossessionato da testo, voce e video, le tabelle rimangono il metodo più utilizzato dalle aziende. "I Master non riescono a gestire molto bene questo tipo di dati." spiegato, "e le aziende attualmente si affidano ad algoritmi di apprendimento automatico della vecchia scuola per fare previsioni."

NEXUS è stato addestrato su miliardi di set di dati tabulari del mondo reale utilizzando Amazon SageMaker HyperPod. A differenza dei tradizionali modelli XGBoost o Random Forest, che richiedono ai data scientist di definire manualmente le funzionalità (variabili specifiche che il modello dovrebbe esaminare), NEXUS è progettato per acquisire direttamente tabelle grezze.

Legge efficacemente il linguaggio nascosto della griglia per comprendere le interazioni non lineari, identificando modelli nascosti tra colonne e righe che gli analisti umani potrebbero non notare.

Trappola di tokenizzazione

Il motivo principale per cui i LLM tradizionali falliscono con i dati tabulari è il modo in cui gestiscono i numeri. Fraenkel spiega che i LLM simboleggiano i numeri proprio come simboleggiano le parole e li scompongono in parti più piccole. "Il problema è che applicano la stessa cosa ai numeri. Tutte le tabelle sono numeriche," Ha sottolineato Fraenkel. "Se hai un numero come 2,3 allora ‘2’, ‘.’ e “3” appaiono come tre simboli diversi. Ciò significa essenzialmente che hai perso la comprensione della distribuzione dei numeri. Non è come una calcolatrice; Non otterrai sempre la risposta giusta perché il modello non comprende intrinsecamente il concetto di numeri."

Inoltre, i dati delle tabelle, a differenza del linguaggio, sono invarianti rispetto all’ordine. Fraenkel utilizza un esempio sanitario per spiegarlo: "Se ti do una tabella con centinaia di migliaia di pazienti e ti chiedo di indovinare quale di loro ha il diabete, non dovrebbe importare se la prima colonna è l’altezza e la seconda il peso o viceversa."

Mentre gli LLM sono estremamente sensibili all’ordine delle parole in un prompt, NEXUS è progettato per comprendere che la modifica delle posizioni delle colonne non dovrebbe influire sulla previsione sottostante.

Lavorare nel livello di previsione

Recenti integrazioni di alto profilo, come Claude di Anthropic che appare direttamente in Microsoft Excel, suggeriscono che i Master stanno già risolvendo fogli di calcolo.

Ma Fraenkel nota che il lavoro di Fundamental opera su un livello fondamentalmente diverso: il livello di previsione. "Ciò che fanno in realtà è a livello della formula; Le formule sono testo, sono come codice," ha detto. "Non stiamo cercando di consentirti di creare un modello finanziario in Excel. Ti aiutiamo a fare previsioni."

NEXUS è progettato per decisioni in frazioni di secondo in cui un essere umano non è coinvolto, come un fornitore di carte di credito che determina se una transazione è fraudolenta nel momento in cui scorri.

Mentre strumenti come Claude possono riassumere un foglio di calcolo, NEXUS è progettato per prevedere la riga successiva, che si tratti di un guasto a un’apparecchiatura in una fabbrica o della probabilità di un paziente di essere riammesso in ospedale.

Architettura e usabilità

La proposta di valore fondamentale di Fundamental è ridurre radicalmente il tempo necessario per ottenere informazioni. Tradizionalmente, la creazione di un modello predittivo può richiedere mesi di lavoro manuale.

"È necessario assumere un esercito di data scientist per creare tutte queste pipeline di dati per elaborare e pulire i dati." Ha spiegato Fraenkel. "Se mancano valori o dati incoerenti, il tuo modello non funzionerà. È necessario creare queste pipeline per ogni caso d’uso."

Affermazioni chiave NEXUS sostituisce l’intero processo manuale con una sola riga di codice. Poiché il modello è pre-addestrato su miliardi di tabelle, non richiede lo stesso livello di formazione specifica per attività o di progettazione delle funzionalità degli algoritmi tradizionali.

Mentre Fundamental passa dalla fase della privacy al mercato più ampio, lo fa con una struttura commerciale progettata per superare le tradizionali sfide dell’adozione del software aziendale.

L’azienda ha già firmato numerosi contratti a sette cifre con organizzazioni Fortune 100; questa è un’impresa facilitata dall’architettura strategica di go-to-market in cui Amazon Web Services (AWS) funge da venditore di record su AWS Marketplace.

Ciò consente ai leader aziendali di fornire e distribuire NEXUS utilizzando i crediti AWS esistenti, trattando efficacemente l’intelligenza predittiva come un’utilità standard insieme all’elaborazione e allo storage. Per gli ingegneri incaricati dell’applicazione, l’esperienza è ad alto impatto ma a basso attrito; NEXUS opera in uno strato puramente predittivo piuttosto che in uno strato conversazionale, tramite un’interfaccia basata su Python.

Gli sviluppatori inseriscono le tabelle grezze direttamente nel modello e contrassegnano colonne target specifiche, come la probabilità di default del prestito o il punteggio del rischio di manutenzione, per attivare la previsione. Il modello restituisce quindi regressioni o classificazioni direttamente allo stack di dati aziendali, agendo come un motore silenzioso e ad alta velocità per il processo decisionale automatizzato piuttosto che come un assistente basato su chat.

Rischi sociali: oltre il risultato

Sebbene le implicazioni aziendali della previsione della domanda e della previsione dei prezzi siano chiare, Fundamental evidenzia il vantaggio sociale dell’intelligenza predittiva.

L’azienda evidenzia le aree chiave in cui NEXUS può prevenire esiti catastrofici identificando segnali nascosti nei dati strutturati.

Analizzando i dati dei sensori e i registri di manutenzione, NEXUS può prevedere malfunzionamenti come la corrosione dei tubi. L’azienda indica la crisi idrica di Flint, la cui riparazione è costata oltre 1 miliardo di dollari, come esempio in cui il monitoraggio predittivo potrebbe prevenire contaminazioni potenzialmente letali.

Allo stesso modo, durante la crisi del COVID-19, la carenza di DPI costa agli ospedali 323 miliardi di dollari in un solo anno. Fondamentale sostiene che, utilizzando dati sulla produzione ed epidemiologici, NEXUS può prevedere le carenze 4-6 settimane prima del picco della domanda e attivare la produzione di emergenza in tempo per salvare vite umane.

Sul fronte climatico, NEXUS mira a fornire previsioni su inondazioni e siccità a 30-60 giorni, come le inondazioni del Pakistan del 2022 che hanno causato danni per 30 miliardi di dollari.

Infine, il modello viene utilizzato per prevedere i rischi di riammissione ospedaliera analizzando i dati demografici dei pazienti e i determinanti sociali. Come afferma l’azienda: "Una madre single che svolge due lavori non dovrebbe tornare al pronto soccorso perché non avevamo previsto che avrebbe avuto bisogno di cure successive."

Prestazioni e latenza

La definizione di “meglio negli affari” varia a seconda del settore. Per alcuni è la velocità; per altri è pura precisione.

"In termini di latenza, dipende dalla situazione di utilizzo." spiega Fraenkel. "Se sei un ricercatore che cerca di capire quali farmaci dovrebbero essere somministrati a un paziente in Africa, il ritardo non ha molta importanza. Stai cercando di prendere una decisione migliore che possa salvare quante più vite possibili."

Al contrario, per una banca o un hedge fund, anche un aumento marginale della precisione rappresenta un grande valore.

"Aumentare l’accuratezza delle previsioni dello 0,5% vale per una banca miliardi di dollari." Fraenkel dice. "L’entità dell’aumento percentuale varia a seconda dei diversi casi d’uso, ma possiamo offrirti prestazioni migliori di quelle attualmente disponibili."

La visione ambiziosa ottiene un enorme sostegno

La serie A da 225 milioni di dollari guidata da Oak HC/FT con la partecipazione di Salesforce Ventures, Valor Equity Partners e Battery Ventures dimostra la convinzione ad alta fiducia che i dati tabulari siano la prossima grande frontiera.

Importanti investitori angelici, inclusi i leader di Perplexity, Wiz, Brex e Datadog, confermano ulteriormente la provenienza dell’azienda.

Annie Lamont, cofondatrice e socio amministratore di Oak HC/FT, ha espresso questo sentimento: "È difficile sopravvalutare l’importanza del modello Fondamentale; i dati strutturati e relazionali devono ancora vedere i vantaggi della rivoluzione del deep learning."

Fondamentale è posizionarsi non solo come un altro strumento di intelligenza artificiale, ma come una nuova categoria di intelligenza artificiale aziendale. Con un team di circa 35 persone con sede a San Francisco, l’azienda si sta allontanando dall’era dei modelli su misura per passare all’era dei modelli base per scrivanie.

"Questi algoritmi tradizionali sono rimasti gli stessi negli ultimi 10 anni; non stanno migliorando," Ha detto Fraenkel. "I nostri modelli continuano ad evolversi. Facciamo la stessa cosa per le tabelle che ChatGPT fa per il testo."

Collaborazione con AWS

Grazie ad una partnership strategica con Amazon Web Services (AWS), NEXUS si integra direttamente nella dashboard di AWS. I clienti AWS possono distribuire il modello utilizzando i crediti e l’infrastruttura esistenti. Fraenkel lo descrive in questo modo: "Un affare davvero unico," Sottolinea che Fundamental è una delle uniche due società di intelligenza artificiale a stabilire una partnership così profonda e multilivello con Amazon.

Uno degli ostacoli più significativi all’intelligenza artificiale aziendale è la privacy dei dati. Le aziende sono spesso riluttanti a spostare i dati sensibili su un’infrastruttura di terze parti.

Per risolvere questo problema, Fundamental e Amazon hanno realizzato un’enorme impresa ingegneristica: la capacità di distribuire modelli completamente crittografati (sia architettura che pesi) direttamente nell’ambiente del cliente. "I clienti possono essere certi di avere i dati con sé," Ha detto Fraenkel. "Siamo la prima e attualmente l’unica azienda a sviluppare una soluzione del genere."

L’emergere di Fundamental è un tentativo di ridefinire il sistema operativo per le decisioni aziendali. Se NEXUS funzionerà come pubblicizzato, affrontando le frodi finanziarie, i prezzi dell’energia e le interruzioni della catena di approvvigionamento con un unico modello generalizzato, segnerà il momento in cui l’intelligenza artificiale imparerà finalmente a leggere i fogli di calcolo che effettivamente governano il mondo. Il potere della previsione non consiste più nel guardare cosa è successo ieri; Si tratta di scoprire il linguaggio segreto dei grafici per determinare cosa accadrà domani.

Collegamento alla fonte