L’opinione comune nel settore è che il 2026 sarà l’anno “2026” "intelligenza artificiale dell’agente." Stiamo rapidamente superando i chatbot che si limitano a riassumere il testo. Stiamo entrando nell’era degli agenti autonomi che eseguono compiti. Ci aspettiamo che prenotino voli, diagnostichino interruzioni del sistema, gestiscano l’infrastruttura cloud e personalizzino i flussi multimediali in tempo reale.
In qualità di dirigente tecnologico che supervisiona piattaforme che servono 30 milioni di utenti simultanei durante i principali eventi globali come le Olimpiadi e il Super Bowl, ho visto la dura verità dietro questa pubblicità: gli agenti sono incredibilmente fragili.
Dirigenti e venture capitalist sono ossessionati dai modelli di riferimento. Stanno discutendo GPT-4 con Llama 3. Si concentrano sulla massimizzazione delle dimensioni della finestra di contesto. Ma ignorano il vero motivo del fallimento. Il motivo principale per cui gli agenti autonomi falliscono nella produzione è spesso dovuto a problemi di igiene dei dati.
Nel periodo precedente "umano nel giro" Analisi e qualità dei dati erano un punto dolente gestibile. Se una linea ETL presenta un problema, il dashboard potrebbe visualizzare un numero di entrate errato. Un analista umano rileverà l’anomalia, la contrassegnerà e la correggerà. Il raggio dell’esplosione è stato controllato.
Nel nuovo mondo degli agenti autonomi, questa rete di sicurezza non esiste più.
Se oggi una linea dati si trascina, un agente non segnalerà semplicemente il numero sbagliato. sbaglia azione. Fornisce il tipo di server sbagliato. Consiglia film horror all’utente che guarda i cartoni animati. Ha allucinazioni sulla risposta del servizio clienti basata su incorporamenti di vettori interrotti.
Mi sono reso conto che la pulizia standard dei dati non era sufficiente per gestire l’intelligenza artificiale su scala NFL o Olimpiadi. Non possiamo proprio "monitorare" dati. Dobbiamo legiferare in merito.
La soluzione a questo problema specifico potrebbe assumere la forma di un quadro di “qualità dei dati – convinzione”. Funziona come una “costituzione dei dati”. Applica migliaia di regole automatizzate prima che un singolo byte di dati possa toccare un modello AI. Anche se l’ho applicato specificamente all’architettura di streaming di NBCUniversal, la metodologia è universale per qualsiasi organizzazione che desideri rendere operativi gli agenti IA.
Ecco perché "ingegneria dei dati per la difesa" E filosofia della fede Questi sono gli unici modi per sopravvivere nell’era delle spie.
Trappola del database vettoriale
Il problema principale con gli agenti AI è che si basano sul contesto che offri loro implicitamente. Se utilizzi RAG, il database dei vettori è la memoria a lungo termine dell’agente.
I problemi di qualità dei dati standard sono disastrosi per i database vettoriali. Nei database SQL tradizionali, un valore null è semplicemente un valore null. In un database vettoriale, un valore nullo o una mancata corrispondenza dello schema possono distorcere la semantica dell’intero incorporamento.
Considera uno scenario in cui i metadati vengono trascinati. Supponiamo che la tua pipeline stia recuperando metadati video, ma che sia causata da una race condition. "tipo" Tagga per diapositiva. I tuoi metadati possono taggare un video come: "sport dal vivo," ma l’incorporamento è stato creato da una fonte "clip di notizie." Quando un agente interroga il database "obiettivi," Recupera il clip delle notizie perché la ricerca della somiglianza vettoriale opera su un segnale distorto. Il broker fornisce quindi questa clip a milioni di utenti.
Su larga scala, non puoi fare affidamento sul monitoraggio al ribasso per rilevarlo. Quando scatta l’allarme di anomalia, l’agente ha già preso migliaia di decisioni sbagliate. I controlli di qualità dovrebbero essere spostati al livello assoluto "Sinistra" dal gasdotto.
"credenza" quadro: 3 principi di sopravvivenza
credenza Si prevede che il framework agisca da custode. Si tratta di un’architettura multi-tenant di alta qualità situata tra fonti di feed e modelli di intelligenza artificiale.
Per i leader tecnologici che desiderano creare le proprie tecnologie "costituzione," Ecco i tre principi indiscutibili che propongo.
1. "quarantena" il modello è obbligatorio: In molte moderne organizzazioni di dati, gli ingegneri "ELT" approccio. Scaricano i dati grezzi in un lago e poi li puliscono. Questo è inaccettabile per gli agenti AI. Non puoi lasciare che un agente beva da un lago sporco.
credenza La metodologia impone un rigido insieme di regole "coda di lettere morte." Se un pacchetto di dati viola un contratto, viene immediatamente messo in quarantena. Non raggiunge mai il database dei vettori. È molto meglio se te lo dice un agente "Non lo so" A causa dei dati mancanti piuttosto che mentire con fiducia a causa di dati errati. Questo "interruttore automatico" Lo schema è importante per prevenire allucinazioni di alto profilo.
2. Lo schema è la legge: Da anni il settore si è mosso nella seguente direzione: "senza diagramma" Flessibilità per muoversi rapidamente. Dobbiamo invertire questa tendenza per le principali pipeline di intelligenza artificiale. Dobbiamo applicare una rigorosa ortografia e integrità referenziale.
Nella mia esperienza, un sistema robusto richiede scala. L’app che sto controllando è attualmente attiva Più di 1.000 regole attive Funziona su flussi in tempo reale. Questi semplicemente non controllano i valori nulli. Controllano la coerenza della logica aziendale.
-
Esempio: Fa questo? "segmento_utente" Il flusso di eventi corrisponde alla tassonomia attiva nel feature store? In caso contrario, bloccalo.
-
Esempio: Il timestamp rientra nell’intervallo di latenza accettabile per l’inferenza in tempo reale? In caso contrario, lascialo stare.
3. Verifiche di coerenza dei vettori Questa è la nuova frontiera degli SRE. Dobbiamo implementare controlli automatici per garantire che i frammenti di testo archiviati in un database vettoriale corrispondano effettivamente ai vettori di incorporamento associati. "Silenzioso" Gli errori nell’API del modello di incorporamento spesso lasciano con vettori che non puntano a nulla. Ciò fa sì che gli agenti ricevano rumore puro.
Guerra culturale: ingegneri contro governance
Applicando un framework come credenza Non è solo una sfida tecnica. È una cosa culturale.
Gli ingegneri generalmente odiano i guardrail. Considerano gli schemi rigidi e i contratti dati come ostacoli burocratici che rallentano il ritmo di implementazione. I leader spesso fanno marcia indietro quando implementano una costituzione basata sui dati. Le squadre pensano di essere di nuovo in campo "cascata" L’era della solida gestione dei database.
Per avere successo, è necessario invertire la struttura degli incentivi. Lo abbiamo mostrato credenza In realtà era un acceleratore. Garantendo la purezza dei dati di input, eliminiamo le settimane trascorse dai data scientist a eseguire il debug delle allucinazioni del modello. Abbiamo spostato la gestione dei dati da un’attività di conformità a un’attività "qualità del servizio" garanzia.
Lezione per i decisori legati ai dati
Se stai costruendo una strategia AI per il 2026, smetti di acquistare più GPU. Smettila di preoccuparti di quale modello base sia un po’ più in alto nella classifica questa settimana.
Inizia a controllare i tuoi contratti dati.
Un agente AI è autonomo tanto quanto i suoi dati sono affidabili. senza una struttura dati rigida e automatizzata come credenza framework, i tuoi agenti alla fine diventeranno canaglia. In un mondo SRE, un agente non autorizzato è molto peggio di un pannello di controllo rotto. È il killer silenzioso della fiducia, dei ricavi e dell’esperienza del cliente.
Manoj Yerrasani è un dirigente senior del settore tecnologico.















