Vale la pena notare che entrambi OpenAI E antropologico I loro client CLI di codifica sono open source su GitHub, consentendo agli sviluppatori di testare direttamente le implementazioni, mentre non fanno lo stesso per ChatGPT o l’interfaccia web Claude.
Uno sguardo ufficiale all’interno del ciclo
Il post di Bolin si concentra su quello che lui chiama “loop dell’agente”, la logica centrale che organizza le interazioni tra l’utente, il modello di intelligenza artificiale e gli strumenti software che il modello invoca per eseguire attività di codifica.
Come abbiamo scritto a dicembre, al centro di ogni agente AI c’è un ciclo di iterazione. L’agente riceve input dall’utente e prepara un prompt di testo per il modello. Il modello genera quindi una risposta, che produce una risposta finale per l’utente o richiede una chiamata a uno strumento (come l’esecuzione di un comando di shell o la lettura di un file). Se il modello richiede una chiamata allo strumento, l’agente la esegue, accoda l’output al prompt originale ed interroga nuovamente il modello. Questo processo si ripete finché il modello non smette di richiedere lo strumento e genera invece un messaggio di assistenza per l’utente.
Questo processo di loop deve iniziare da qualche parte e il post di Bolin rivela come il codice genera il prompt iniziale inviato all’API React di OpenAI, che gestisce la stima del modello. Il prompt è composto da diversi componenti, ciascuno con un ruolo specifico che ne determina la priorità: sistema, sviluppatore, utente o assistente.
Il campo delle direttive proviene da un file di configurazione specifico dell’utente o dalle direttive di base fornite con la CLI. Il campo strumento definisce quali funzioni il modello può chiamare, inclusi comandi shell, strumenti di pianificazione, funzionalità di ricerca web e qualsiasi strumento personalizzato fornito dal server MCP (Model Context Protocol). Il campo di input contiene una serie di elementi che descrivono le autorizzazioni sandbox, le istruzioni facoltative per lo sviluppatore, il contesto dell’ambiente come la directory di lavoro corrente e infine il messaggio effettivo per l’utente.

