questo fine settimana, Andrej Karpathyex direttore dell’intelligenza artificiale di Tesla e membro fondatore di OpenAI, ha deciso che voleva leggere un libro. Ma non voleva studiare da solo. Voleva leggere con un comitato di IA, ognuno dei quali offriva la propria prospettiva, criticava gli altri e alla fine sintetizzava una risposta finale sotto la guida di un esperto. "Ministro."
Per far sì che ciò accada, Karpathy ha scritto, con parole sue: "progetto sul codice delle vibrazioni" – un software più per divertimento che per funzione, in gran parte scritto rapidamente da assistenti AI. Inviato il risultato a un repository denominato . "Consiglio dei laureati," Con un rigoroso disclaimer da parte di GitHub: "Non lo supporterò in alcun modo… Il codice ora è temporaneo e le librerie sono finite."
Ma per i decisori tecnici nell’ambiente aziendale, guardare oltre il banale disclaimer rivela qualcosa di molto più importante di un giocattolo del fine settimana. In poche centinaia di righe Pitone E JavaScriptKarpathy ha delineato un’architettura di riferimento per lo strato più critico e indefinito del moderno stack software: il middleware di orchestrazione che si trova tra le applicazioni aziendali e il mercato volatile dei modelli di intelligenza artificiale.
Mentre le aziende completano gli investimenti sulla piattaforma per il 2026, Consiglio dei laureati Offre una visualizzazione semplificata "costruire e acquistare" La realtà dell’infrastruttura di intelligenza artificiale. Sebbene la logica per indirizzare e combinare i modelli di intelligenza artificiale sia sorprendentemente semplice, la vera complessità risiede nell’involucro operativo necessario per renderlo pronto per l’impresa.
Come funziona il Consiglio del Master: quattro modelli di intelligenza artificiale discutono, criticano e sintetizzano le risposte
All’osservatore casuale, Consiglio dei laureati L’app Web sembra quasi identica a ChatGPT. L’utente digita una query in una casella di chat. Ma dietro le quinte, l’app attiva un complesso flusso di lavoro in tre fasi che rispecchia il funzionamento degli organi decisionali umani.
Innanzitutto, il sistema invia la query dell’utente a un pannello di modelli di confine. Nella configurazione predefinita di Karpathy questo include OpenAI GPT-5.1Quello di Google Gemelli 3.0 Proantropico Claude Sonetto 4.5e xAI Grok 4. Questi modelli producono le loro risposte iniziali in parallelo.
Nella seconda fase, il software esegue una peer review. A ogni modello vengono fornite risposte anonime dalle sue controparti e viene chiesto di valutarle in base a accuratezza e intuizione. Questo passaggio trasforma l’IA da creatore a critico, applicando un livello di controllo di qualità raro nelle interazioni standard dei chatbot.
Una decisione finalmente determinata "Laurea Magistrale del Presidente" – attualmente configurato come Gemini 3 di Google – recupera la query originale, le risposte individuali e le classifiche dei pari. Sintetizza questa parte di contesto in un’unica risposta autorevole per l’utente.
I risultati sono spesso sorprendenti, ha detto Karpathy. "Spesso, i modelli sono sorprendentemente disposti a scegliere la risposta di un altro LLM come superiore alla propria." ha scritto su X (ex Twitter). Ha descritto l’utilizzo dello strumento per leggere i capitoli di libri e ha osservato che i modelli hanno costantemente elogiato GPT-5.1 come il modello più approfondito, mentre hanno valutato Claude come il più basso. Tuttavia, la valutazione qualitativa di Karpathy differiva da quella del consiglio digitale; trovato GPT-5.1 "molto loquace" e ho scelto questo "condensato ed elaborato" La produzione dei Gemelli.
Il caso di trattare FastAPI, OpenRouter e modelli edge come componenti modificabili
Valore per CTO e architetti di piattaforme Consiglio dei laureati Non sta nella sua critica letteraria ma nella sua struttura. Il repository funge da documento principale per sapere esattamente come apparirà uno stack AI moderno e minimale alla fine del 2025.
L’applicazione è costruita su una base. "magro" Architettura. Utilizza il back-end API veloceuno moderno Pitone telaio, la parte anteriore è standard Reagire Applicazione creata con Velocemente. L’archiviazione dei dati è gestita da un processo semplice e non da un database complesso. File JSON viene scritto sul disco locale.
Il fulcro dell’intera operazione Apri RouterUn aggregatore API che normalizza le differenze tra i vari fornitori di modelli. Instradando le richieste attraverso questo singolo intermediario, Karpathy ha evitato di scrivere un codice di integrazione separato. OpenAI, GoogleE antropico. L’app non sa né si preoccupa di quale azienda fornisce l’intelligence; invia semplicemente un prompt e attende una risposta.
Questa scelta progettuale sottolinea una tendenza crescente nell’architettura aziendale: la mercificazione dello strato del modello. Trattando i modelli di confine come componenti mutabili che possono essere modificati modificando una singola riga in un file di configurazione (in particolare, l’elenco COUNCIL_MODELS nel codice backend), l’architettura protegge l’applicazione dal vincolo del fornitore. Se si tratta di un nuovo modello Meta O maestrale Se si posizionerà in alto nella classifica della leadership la prossima settimana, potrebbe essere aggiunto al consiglio in pochi secondi.
Cosa manca dal prototipo alla produzione: autenticazione, orchestrazione PII e conformità
La logica di base è Consiglio dei laureati È elegante, ma serve anche come esempio lampante del divario tra una persona. "trucco del fine settimana" e un sistema di produzione. Per un team di piattaforme aziendali, la clonazione del repository di Karpathy è solo il primo passo di una maratona.
L’audit tecnico del codice rivela carenze "noioso" infrastrutture che i venditori commerciali vendono a prezzi elevati. Il sistema manca di autenticazione; Chiunque abbia accesso all’interfaccia web può interrogare i modelli. Non esiste il concetto di ruoli utente; Ciò significa che il co-sviluppatore ha gli stessi diritti di accesso del CIO.
Inoltre, non esiste un livello di gestione. In un ambiente aziendale, l’invio simultaneo di dati a quattro diversi fornitori di intelligenza artificiale esterni fa scattare immediati problemi di conformità. In questo caso non esiste alcun meccanismo per organizzare le informazioni di identificazione personale (PII) prima che lascino la rete locale, né un registro di controllo per tenere traccia di chi ha chiesto cosa.
L’affidabilità è un’altra questione aperta. Il sistema presuppone: API OpenRouter è sempre funzionante e i modelli risponderanno in tempo. Quando un provider subisce un’interruzione, non dispone degli interruttori automatici, delle strategie di fallback e della logica dei tentativi che mantengono in esecuzione le applicazioni business-critical.
Queste carenze non sono difetti del codice di Karpathy – ha chiarito che non ha intenzione di sostenere o sviluppare il progetto – ma definiscono la proposta di valore per il mercato commerciale delle infrastrutture di intelligenza artificiale.
come le aziende LangChain, Base rocciosa dell’AWSe varie startup di gateway AI vendono principalmente: "indurimento" Riguarda la logica di base mostrata da Karpathy. Forniscono wrapper di sicurezza, osservabilità e conformità che trasformano uno script di orchestrazione grezzo in una piattaforma aziendale valida.
Karpathy, perché non hai più il tuo codice? "temporaneo" e le librerie software tradizionali non vengono più utilizzate
Forse l’aspetto più provocatorio del progetto è la filosofia su cui è stato costruito. Karpathy ha descritto il processo di sviluppo come segue: "Vibrazione codificata al 99%.," Ciò implicava che facesse molto affidamento sugli assistenti IA, piuttosto che scrivere lui stesso il codice riga per riga.
"Il codice ora è temporaneo e le librerie sono finite, chiedi al tuo LLM di cambiarlo in quello che desideri," ha scritto nei documenti del repository.
Questa affermazione segna un cambiamento radicale nel talento dell’ingegneria del software. Tradizionalmente, le aziende creano librerie interne e astrazioni per gestire la complessità e mantenerle per anni. Karpathy propone un futuro in cui il codice viene gestito in questo modo: "impalcatura veloce" – è usa e getta, può essere facilmente riscritto dall’intelligenza artificiale e non è destinato a durare.
Per i decisori aziendali, ciò solleva una difficile questione strategica. Strumenti interni, se possibile "vibrazione codificata" Ha senso acquistare pacchetti software costosi e rigidi per i flussi di lavoro interni durante un fine settimana? Oppure i team della piattaforma dovrebbero consentire ai propri ingegneri di produrre strumenti personalizzati e usa e getta che soddisfino le loro precise esigenze a una frazione del costo?
Quando i modelli di intelligenza artificiale giudicano l’intelligenza artificiale: il pericoloso divario tra le preferenze delle macchine e i bisogni umani
Oltre l’architettura, Consiglio dei laureati Il progetto fa inavvertitamente luce su un rischio particolare nell’implementazione automatizzata dell’IA: la differenza tra il giudizio umano e quello della macchina.
L’osservazione di Karpathy secondo cui i suoi modelli preferivano GPT-5.1 mentre i suoi Gemelli preferivano suggerisce che i modelli di intelligenza artificiale potrebbero avere pregiudizi comuni. Potrebbero preferire i dettagli, la formattazione specifica o la sicurezza retorica che non è compatibile con le esigenze aziendali umane di brevità e accuratezza.
Mentre le imprese diventano sempre più dipendenti "Master come giudice" Questa discrepanza è importante per i sistemi di valutazione della qualità dei bot rivolti al cliente. Se il valutatore automatico premia costantemente "lungo e disteso" Poiché i clienti umani desiderano soluzioni concise, le misurazioni indicheranno il successo mentre la soddisfazione del cliente diminuisce. L’esperimento di Karpathy mostra che fare affidamento esclusivamente sull’intelligenza artificiale per classificarla è una strategia irta di problemi di allineamento nascosti.
Cosa possono imparare i team delle piattaforme aziendali dagli hack del fine settimana prima di costruire i loro stack 2026?
Dopotutto, Consiglio dei laureati Serve come test di Rorschach per l’industria dell’intelligenza artificiale. Leggere libri come hobby è un modo divertente per farlo. Per il venditore, questa è una minaccia, poiché dimostra che la funzionalità di base del suo prodotto può essere copiata con poche centinaia di righe di codice.
Ma per il leader tecnologico aziendale, questa è un’architettura di riferimento. Demistifica il livello di orchestrazione mostrando che la sfida tecnica sta nella gestione dei dati, non nell’indirizzare le richieste.
Mentre i team della piattaforma si spostano nel 2026, la maggior parte delle persone probabilmente si ritroverà a guardare il codice di Karpathy non per distribuirlo, ma per capirlo. Ciò dimostra che una strategia multi-modello non è tecnicamente irraggiungibile. Resta la questione se le aziende creeranno da sole il livello di governance o pagheranno qualcun altro per completarlo. "codice di vibrazione" blindato a livello aziendale.















