Gli agenti di codifica possono produrre migliaia di righe di codice in pochi minuti. Problema: la maggior parte non è distribuibile. Viola gli standard interni, non supera i controlli di conformità o crea più lavoro di pulizia di quanto ne risparmi.

"Puoi generare tonnellate di codice, ma in realtà non significa nulla, giusto? Il codice deve essere integrabile, compatibile e non vuoi creare più lavoro sul backend solo perché stai accelerando la generazione del codice sul frontend." ha affermato Stephen Newman, responsabile tecnico CTO globale di EY.

Il team di sviluppo prodotto di EY ha risolto questo problema collegando gli agenti di codifica ai propri standard tecnici, repository di codici e framework di conformità. Il risultato: un aumento della produttività da 4 a 5 volte tra i team che costruiscono le piattaforme di audit, fiscali e finanziarie di EY.

Ma i vantaggi non sono stati ottenuti semplicemente utilizzando uno strumento. Il team di Newman ha impiegato dai 18 ai 24 mesi per costruire le basi culturali e le integrazioni tecniche che avrebbero consentito un lavoro di codifica semi-autonomo su larga scala.

Il primo passo è stato culturale. EY ha iniziato con strumenti in stile GitHub Copilot che mettono gli ingegneri a proprio agio con una progettazione rapida e un’intelligenza artificiale utile. Il vero apprendimento, ha affermato Newman, è rendere l’adozione dell’IA organica piuttosto che forzarla dalla leadership. "È importante fornire funzionalità di intelligenza artificiale come adozione organica dal basso, anziché imporle agli utenti." ha detto.

Gli sviluppatori volevano andare oltre la generazione del codice per arrivare alla compilazione, distribuzione e operatività. Ma senza un’integrazione più profonda, i guadagni di produttività si sono stabilizzati.

Newman si rese conto che gli agenti avevano bisogno di accedere ai repository di codici, agli standard tecnici e ai cataloghi di sorgenti di EY per creare codice distribuibile. senza di esso "universo del contesto," Nelle parole di Newman, gli intermediari producono risultati generici che richiedono ampie rielaborazioni.

EY ha valutato più piattaforme agente: Lovable, Replit e Droids basati su IDE di Factory. Invece di imporre uno strumento, il team di Newman ha misurato l’adozione, l’utilizzo e la produttività di tutti e tre gli strumenti.

"Come team di leadership, non volevamo essere così prescrittivi da impostare uno strumento e semplificarlo." Newman ha detto. Sviluppatori "davvero girato e diretto" Alla Fabbrica, che è diventata un segnale che fornisce valore reale.

Adozione in fabbrica "è decollato a macchia d’olio" una volta promosso da valutazione a progetto pilota. EY ha dovuto limitare il traffico verso Factory e Droids e limitare i repository che potevano connettersi prima di ottenere la conformità e l’approvazione della sicurezza.

Quadro di classificazione del carico di lavoro

L’entusiasmo degli sviluppatori ha reso chiaro che EY aveva bisogno di disciplina su quali carichi di lavoro delegare agli agenti. Il team di Newman ha diviso i compiti in due categorie:

Missioni con elevata autonomia gli agenti gestiscono bene:

  • Revisione del codice

  • Documentazione

  • correzione del difetto

  • Caratteristiche del campo verde

compiti complessi quelli che necessitano ancora di supervisione umana:

  • Refactoring su larga scala

  • decisioni architettoniche

  • Integrazioni tra sistemi

EY ha anche cambiato i ruoli degli sviluppatori. Invece di scrivere tutto il codice da soli, gli ingegneri sono diventati orchestratori, indirizzando gli agenti verso i database e i repository giusti.

Una volta implementate le barriere di sicurezza e completata l’integrazione nei repository di codici, EY ha misurato guadagni di produttività compresi tra il 15% e il 60% tra diversi individui durante la fase di adozione iniziale.

"C’è un salto che abbiamo fatto in molti dei nostri prodotti in cui siamo passati a quello che io chiamo sviluppo del modello orizzonte, dove abbiamo un’esecuzione di agenti semi-autonomi su larga scala, dove abbiamo un team di orchestratori anziché esecutori e dove abbiamo integrazioni nell’universo del contesto." Newman ha detto.

Newman ha riconosciuto che è difficile attribuire guadagni di produttività da 4 a 5 volte solo agli agenti di codifica. I miglioramenti sono stati ottenuti attraverso tentativi ed errori insieme a cambiamenti culturali e comportamentali nei team di sviluppatori.

Collegamento alla fonte