Il mondo dell’ingegneria del software è attualmente alle prese con un paradosso fondamentale dell’era dell’intelligenza artificiale: man mano che i modelli diventano più capaci, "problema del sistema" gestirli è diventato il principale ostacolo alla produttività nel mondo reale. Sebbene uno sviluppatore possa avere accesso all’intelligenza grezza di un modello edge, tale intelligenza viene spesso danneggiata nel momento in cui un’attività richiede un lungo orizzonte o una profonda finestra di contesto.

Ma sembra che l’aiuto sia in arrivo: startup con sede a San Francisco, sostenuta da Y Combinator Laboratori casuali avere Slate V1 rilasciato ufficialmenteViene descritto come il primo nel settore "gregge autoctono" Agente di codifica autonomo progettato per gestire attività di ingegneria estremamente parallele e complesse.

Il veicolo rilasciato dalla beta aperta, "algoritmo di potatura dinamica" preservare il contesto su basi di codice di grandi dimensioni adattando al contempo l’output alla complessità aziendale. Co-fondato da Kiran e Mihir Chintawar nel 2024L’azienda mira a colmare il divario ingegneristico globale posizionando Slate come strumento collaborativo. "I prossimi 20 milioni di ingegneri" piuttosto che sostituire gli sviluppatori umani.

Con il rilascio di Slate V1, il team di Random Labs sta cercando di escogitare una via d’uscita da questo territorio fornendo la prima versione. "pacchetto nativo" ambiente di codifica dell’agente. Slate non è solo un wrapper o un chatbot per l’accesso ai file; questa è un’implementazione di un’applicazione "mente alveare" Filosofia progettata per adattare il lavoro rappresentativo alla complessità di un’organizzazione umana.

Sfruttando una nuova primitiva architettonica Tessitura del filoSlate va oltre i rigidi alberi delle attività e i metodi di compressione con perdita che hanno definito la prima generazione di assistenti di codifica AI.

Strategia: Campo d’azione

La base dell’efficacia di Slate è Modelli linguistici ricorsivi (RLM).

In un’installazione tradizionale, a un agente potrebbe essere chiesto di: "correggere un errore," un suggerimento che forza il modello a bilanciare simultaneamente la strategia di alto livello e l’esecuzione di basso livello.

Random Labs definisce questo come un mancato sfruttamento "Rigonfiamento delle informazioni"- Intelligenza nascosta di cui un modello dispone ma a cui non può accedere efficacemente quando tatticamente sopraffatto.

Slate risolve questo problema utilizzando un thread di orchestrazione centrale. "programmi nel campo d’azione". Questo orchestratore non scrive direttamente il codice; utilizza invece un DSL basato su TypeScript per inviare thread in esecuzione in parallelo per eseguire attività specifiche e limitate.

Ciò crea una chiara distinzione tra loro. "seme di girasole"Gestire il grafico di esecuzione e mantenere l’allineamento strategico e dei dipendenti "processi" Condurre operazioni tattiche nel terminale.

Mappandolo su un framework in stile sistema operativo ispirato a quello di Andrej Karpathy "Sistema operativo della laurea magistrale" Secondo questo concetto, Slate può trattare la finestra di contesto limitata di un modello come preziosa RAM e gestire attivamente e in modo intelligente ciò che viene mantenuto e ciò che viene scartato.

Memoria episodica e gregge

vera innovazione "Tessitura del filo" L’approccio sta nel modo in cui gestisce la memoria. Oggi la maggior parte delle agenzie si affida a "compressione," questo è spesso un termine di fantasia per indicare la compressione con perdite che rischia di degradare lo stato critico del progetto. Invece Slate crea questo: "sezioni".

Quando un thread di lavoro completa un’attività, non restituisce un dump completo di ogni tentativo fallito; Restituisce un riepilogo compresso delle chiamate allo strumento riuscite e dei relativi risultati.

Poiché queste partizioni condividono il contesto direttamente con l’orchestratore anziché fare affidamento sul fragile passaggio di messaggi, il sistema "gregge" intelligenza.

Questa architettura consente un parallelismo massiccio. Uno sviluppatore può chiedere a Claude Sonnet di modificare un refactoring complesso mentre esegue il codice GPT-5.4 e GLM 5, uno dei preferiti per le sue capacità di ricerca mediata, e cerca contemporaneamente la documentazione della libreria in background. Questo è un approccio simile che Perplexity sta adottando con il suo nuovo agente multi-modello per computer.

selettivamente "il modello giusto per il lavoro," Slate garantisce che gli utenti non spendano troppo in intelligenza per semplici passaggi tattici, beneficiando al tempo stesso della profondità strategica dei modelli più potenti del mondo.

attività di autonomia

Dal punto di vista aziendale, Random Labs sta attraversando il suo primo periodo beta con un mix di trasparenza e incertezza strategica.

Sebbene la società non abbia ancora pubblicato una pagina di abbonamento a prezzo fisso, la documentazione della CLI di Slate conferma il passaggio a un modello di credito basato sull’utilizzo.

Comandi come /usage e /billing consentono agli utenti di tenere traccia del consumo di credito in tempo reale e l’inclusione di passaggi di fatturazione a livello di organizzazione suggerisce una chiara attenzione ai team di ingegneri professionisti piuttosto che agli hobbisti solitari.

C’è anche un passo importante verso l’integrazione. Random Labs ha recentemente annunciato che la prossima settimana verrà rilasciato il supporto diretto per Codex di OpenAI e Claude Code di Anthropic.

Ciò suggerisce che Slate non sta cercando di competere con le interfacce native di questi modelli, ma piuttosto di agire come un livello di orchestrazione superiore che consenta agli ingegneri di utilizzarli tutti contemporaneamente, in modo sicuro ed economico.

ho ottenuto questo:

Dal punto di vista architettonico, il sistema è progettato per massimizzare la memorizzazione nella cache attraverso il riutilizzo del thread figlio. "nuova ingegneria del contesto" Il trucco, sostiene il team, impedisce che l’approccio “gregario” diventi un onere finanziario per gli utenti.

Determinazione IA

Forse l’argomento più convincente a favore dell’architettura in ardesia è la sua stabilità. Nei test interni, una versione precedente di questo sistema di threading è riuscita a superare 2/3 dei test nell’attività make-mips-interpreter all’interno del pacchetto Terminal Bench 2.0.

Questo è un compito in cui anche le ultime ammiraglie, come l’Opus 4.6, riescono in genere meno del 20% delle volte se utilizzate su hardware standard e non regolamentato.

Questo successo è a "mutato" oppure l’ambiente in evoluzione è ciò che separa un agente da un partner. Secondo la documentazione di Random Labs, Un fondatore fintech di New York descrive Slate come la sua azienda "miglior strumento di debug," È un sentimento che riflette l’obiettivo più ampio di Random Labs: creare agenti che si adattino a un’impresa, non solo a completare un prompt.

Mentre il settore va oltre il semplice "chattare con il tuo codice" interfacce, "Tessitura del filo" Slate V1 offre uno sguardo su un futuro in cui il ruolo primario dell’ingegnere umano è quello di dirigere una mente alveare di modelli specializzati, ciascuno dei quali lavora in armonia per risolvere i problemi a lungo termine del software moderno.

Collegamento alla fonte