Home Politica Perché la maggior parte dei progetti pilota di codifica IA aziendale hanno...

Politica

Perché la maggior parte dei progetti pilota di codifica IA aziendale hanno prestazioni inferiori (suggerimento: non è il modello)

13 Dicembre 2025

La generazione di intelligenza artificiale nell’ingegneria del software è andata ben oltre il completamento automatico. La frontiera emergente è la codifica mediata: sistemi di intelligenza artificiale in grado di pianificare i cambiamenti, implementarli in più passaggi e iterare in base al feedback. Ma nonostante l’entusiasmo per la “codifica degli agenti AI”, la maggior parte delle implementazioni aziendali hanno prestazioni inferiori. Il fattore limitante non è più il modello. Il suo contesto: La struttura, la storia e lo scopo che circonda il codice modificato. In altre parole, le aziende si trovano ora ad affrontare un problema di progettazione del sistema: non hanno ancora progettato l’ambiente in cui operano questi agenti.

Transizione dall’assistenza alla rappresentanza

L’anno scorso si è assistito a una rapida evoluzione dagli strumenti di codifica assistiva ai flussi di lavoro mediati. La ricerca ha iniziato a formalizzare cosa significhi in pratica il comportamento degli agenti: la capacità di ragionare attraverso la progettazione, il test, l’esecuzione e la verifica piuttosto che costruire widget separati. Funziona come ricampionamento dinamico dell’azione mostra che consentire agli agenti di ramificare, ripensare e rivedere le proprie decisioni migliora significativamente i risultati su codebase di grandi dimensioni e interdipendenti. A livello di piattaforma, provider come GitHub stanno ora creando ambienti di orchestrazione degli agenti dedicati: Rappresentante del Copilota e Sede dell’Agenteper supportare la collaborazione multi-agente all’interno di vere e proprie pipeline aziendali.

Ma i primi risultati sul campo raccontano un avvertimento. Quando le organizzazioni iniziano a utilizzare strumenti intermediari senza affrontare il flusso di lavoro e l’ambiente, la produttività può diminuire. Uno studio di controllo randomizzato di quest’anno ha dimostrato che gli sviluppatori che utilizzano l’assistenza dell’intelligenza artificiale in flussi di lavoro immutabili hanno completato le attività più lentamente, in gran parte a causa di verifiche, rielaborazioni e confusione sullo scopo. La lezione è semplice: l’autonomia senza regolamentazione raramente produce efficienza.

Perché l’ingegneria del contesto sblocca la realtà?

In ogni distribuzione fallita che ho osservato, il fallimento era dovuto al contesto. Laddove gli agenti non hanno una comprensione strutturata della base di codice, in particolare dei moduli pertinenti, del grafico delle dipendenze, del test cablaggio, delle regole dell’architettura e della cronologia delle modifiche. Spesso producono risultati che sembrano corretti ma sono disconnessi dalla realtà. Troppe informazioni travolgono l’agente; pochi lo fanno indovinare. L’obiettivo non è quello di alimentare il modello con più monete. L’obiettivo è determinare cosa dovrebbe apparire all’agente, quando e in quale formato.

I team che vedono guadagni significativi trattano il contesto come una superficie ingegneristica. Creano strumenti per scattare un’istantanea della memoria di lavoro dell’agente, comprimendola e creando versioni: ciò che viene mantenuto su più righe, scartato, riepilogato e collegato anziché in linea. Progettano le fasi della negoziazione piuttosto che condurre le sessioni. Rendono le specifiche non una storia di chat passeggera ma una struttura di prima classe, qualcosa che può essere esaminato, testato e posseduto. Questo cambiamento coincide con una tendenza più ampia che alcuni ricercatori descrivono come “le specifiche tecniche diventano la nuova fonte di verità”.

Anche il flusso di lavoro deve cambiare con gli strumenti

Ma il contesto da solo non basta. Le organizzazioni devono riprogettare i flussi di lavoro attorno a questi intermediari. Come Rapporto McKinsey 2025 “Un anno di intelligenza artificiale dell’agenzia” È stato affermato che gli incrementi di produttività non derivano dall’integrazione dell’intelligenza artificiale nei processi esistenti, ma dal ripensamento del processo stesso. Quando i team lasciano un agente in un flusso di lavoro non modificato, creano attriti: gli ingegneri dedicano più tempo alla convalida del codice scritto dall’intelligenza artificiale rispetto a quanto farebbero da soli. I broker possono solo rafforzare ciò che è già strutturato: basi di codice modulari e ben testate con proprietà e documentazione chiare. Senza queste basi l’autonomia si trasforma in caos.

Anche la sicurezza e la governance richiedono un cambiamento di mentalità. Il codice generato dall’intelligenza artificiale introduce nuove forme di rischio: dipendenze non riviste, sottili violazioni della licenza e moduli non documentati che sfuggono alla revisione tra pari. I team maturi stanno iniziando a integrare l’attività degli agenti direttamente nelle loro pipeline CI/CD, trattando gli agenti come contributori autonomi il cui lavoro deve passare attraverso la stessa analisi statica, registrazione di controllo e controlli di approvazione di qualsiasi sviluppatore umano. La documentazione di GitHub evidenzia questa tendenza, posizionando gli agenti Copilot non come sostituti degli ingegneri ma come partecipanti orchestrati in flussi di lavoro sicuri e rivedibili. L’obiettivo non è lasciare che un’intelligenza artificiale “scriva tutto”, ma garantire che quando agisce, lo faccia entro limiti definiti.

Su cosa dovrebbero concentrarsi ora i decisori aziendali?

Per i leader tecnici, il percorso da seguire inizia con la preparazione piuttosto che con l’entusiasmo. I monoliti con test sparsi raramente producono guadagni netti; Gli intermediari prosperano dove i test sono affidabili e possono incoraggiare miglioramenti iterativi. Questo è esattamente il ciclo antropico invita le agenzie di codifica. Progetti pilota in aree con ambito ristretto (generazione di test, modernizzazione dell’eredità, refactoring isolati); trattare ogni distribuzione come un esperimento con parametri chiari (tasso di fuga dei difetti, durata del ciclo PR, tasso di errore delle modifiche, risultati di sicurezza esauriti). Man mano che il tuo utilizzo cresce, tratta gli agenti come un’infrastruttura di dati: ogni piano, istantanea del contesto, registro delle azioni ed esecuzione di test sono dati assemblati in una memoria ricercabile di intenti ingegneristici e un vantaggio competitivo duraturo.

Fondamentalmente, la codifica delle agenzie è più un problema di squadra che un problema di dati. Ogni istantanea del contesto, iterazione di test e revisione del codice diventa un tipo di dati strutturati che devono essere archiviati, indicizzati e riutilizzati. Man mano che questi intermediari proliferano, le aziende si troveranno a gestire un livello di dati completamente nuovo: uno che cattura non solo ciò che viene costruito, ma anche il modo in cui viene giustificato. Questo cambiamento trasforma i log di progettazione in un grafico della conoscenza di intenti, processi decisionali e convalida. Nel corso del tempo, le organizzazioni in grado di cercare e riprodurre questa memoria contestuale supereranno le organizzazioni che trattano ancora il codice come testo statico.

Il prossimo anno probabilmente determinerà se la codifica delle agenzie sarà la pietra angolare dello sviluppo aziendale o solo l’ennesima promessa pubblicizzata. La differenza starà nell’ingegneria del contesto: quanto abilmente i team progettano il substrato informativo su cui fanno affidamento i loro agenti. I vincitori saranno coloro che vedono l’autonomia non come magia, ma come un’estensione della progettazione disciplinata del sistema: flussi di lavoro chiari, feedback misurabile e gestione rigorosa.

Insomma

Le piattaforme stanno convergendo sull’orchestrazione e sui guardrail e la ricerca continua a migliorare il controllo del contesto al momento dell’inferenza. A vincere nei prossimi 12-24 mesi non saranno le squadre con i modelli più appariscenti; Saranno loro a progettare il contesto come una risorsa e a trattare il flusso di lavoro come un prodotto. Fate questo e l’autonomia si fonderà. Saltare e rivedere la coda lo fa.

Contesto + agenzia = leva. Salta la prima metà e il resto crolla.

Dhyey Mavani accelera l’intelligenza artificiale generativa su LinkedIn.

Per saperne di più scrittori ospiti. Oppure considera di inviare il tuo! Dai un’occhiata al nostro istruzioni qui.

Collegamento alla fonte

Perché la maggior parte dei progetti pilota di codifica IA aziendale hanno prestazioni inferiori (suggerimento: non è il modello)

Transizione dall’assistenza alla rappresentanza

Perché l’ingegneria del contesto sblocca la realtà?

Anche il flusso di lavoro deve cambiare con gli strumenti

Su cosa dovrebbero concentrarsi ora i decisori aziendali?

Insomma

Ultimo post

Caitlin Clark affronta una reazione negativa durante la storica corsa March...

I partenariati sono fondamentali per mantenere la stabilità negli Stati membri...

I Penguins affrontano Dallas senza Crosby e Malkin sotto la pressione...

Folle enormi alle proteste “No King”, deriso l’amministratore Trump

La Redazione partecipa a ‘Earth Hour’

I Penguins hanno brutte notizie per l’infortunio di Sidney Crosby prima...

Tom Izzo, 71 anni, prende in giro il discorso sulla pensione...

Jurgen Klopp conferma quando tornerà al Liverpool dopo l’emozionante accoglienza ad...

Il deputato repubblicano accusa l’amministratore di Trump di “rifare siti porno”

Polemica su Mayo Lake | Cresce l’opposizione al nuovo cambiamento delle...

Dan Hurley ha inviato un messaggio chiaro a Tom Izzo del...

La Dominica si reca in Guyana nella serie CONCACAF

Categoria