Ultimamente Rilascio di GPT 5.2OpenAI ha aggiornato altri modelli correlati, incluso il suo popolare modello di codifica Codex, per incorporare più casi d’uso degli agenti.

OpenAI chiama il codice GPT-5.2 in un post sul blog Il “modello di codifica con agenti più avanzato di sempre per ingegneri software complessi e reali” è ottimizzato per il lavoro a lungo termine con gli agenti e avrà capacità di sicurezza informatica più forti.

Il modello è un ramo di GPT-5.2 ed è ottimizzato per l’agenzia.

“Il GPT-5.2-Codex rappresenta un passo avanti nel modo in cui l’intelligenza artificiale avanzata può supportare l’ingegneria del software nel mondo reale e campi specializzati come la sicurezza informatica, aiutando sviluppatori e difensori ad affrontare lavori complessi e a lungo termine e rafforzando gli strumenti esistenti per la ricerca sulla sicurezza responsabile”, ha affermato la società nel suo post sul blog.

Le organizzazioni “possono accedere al nuovo modello Codex su tutte le superfici Codex per gli utenti ChatGPT a pagamento e stanno lavorando per fornire in modo sicuro l’accesso al GPT‑5.2‑Codex per gli utenti API nelle prossime settimane.” L’azienda sta inoltre sperimentando un programma solo su invito per consentire agli utenti fidati di accedere a “modelli più indulgenti per professionisti e organizzazioni controllati” per sforzi difensivi di sicurezza informatica per trovare un equilibrio tra accessibilità e sicurezza.

Sviluppi nella sicurezza informatica con modelli

OpenAI definisce GPT-5.2-Codex il suo modello di sicurezza informatica più potente di sempre. Tuttavia, man mano che le sue capacità crescono, l’azienda deve progettare un approccio di implementazione che tenga conto della crescita futura e supporti la sicurezza informatica difensiva, ha affermato.

“Mentre i nostri modelli continuano ad avanzare alla frontiera dell’intelligence, abbiamo osservato che questi progressi si stanno traducendo anche in progressi di capacità in aree specifiche come la sicurezza informatica”, ha affermato la società.

OpenAI ha detto sulla scheda di sistema ha affermato di aver testato il modello su tre parametri di riferimento: valutazioni Capture the Flag (CTF), CVE-Bench e Cyber ​​​​Range.

GPT-5.2-Codex è diventato il modello dell’azienda con le prestazioni più elevate nei benchmark CTF, che hanno attribuito alla compressione o “alla capacità del modello di operare in modo coerente su più finestre di contesto”.

Il modello ha sovraperformato gli altri modelli, ottenendo un punteggio dell’87% su CVE-Bench, seguito da vicino da GPT-5.1-Codex-Max. Questo aumento sarà utile in attività che implicano l’esecuzione di comandi relativi alla scoperta di vulnerabilità e strumenti di test “in un approccio quasi di forza bruta”.

Nel test Cyber ​​Range di lunga durata, il tasso di superamento complessivo del modello è stato del 72,7%. GPT-5.1-Codex-Max ha ottenuto l’81,8%.

Progetto di implementazione della sicurezza informatica

OpenAI ha detto alcuni utenti di GPT-5.1-Codex-Max: lanciato a novembreHa scoperto una vulnerabilità legata all’esposizione del codice sorgente in React e poi l’ha segnalata. Andrew MacPherson, ricercatore di sicurezza presso Privy, ha utilizzato GPT-5.1-Codex-Max per valutare quanto bene il modello potesse supportare la ricerca sulle vulnerabilità nel mondo reale, secondo OpenAI. Invece il modello ha riscontrato un comportamento imprevisto.

Con i miglioramenti nelle capacità di sicurezza informatica per GPT-5.2-Codex e potenzialmente i modelli che lo seguiranno, OpenAI ha affermato che deve bilanciare l’implementazione dei modelli edge con gli strumenti necessari per la sicurezza informatica difensiva. Sebbene GPT-5.2-Codex “non raggiunga livelli elevati di capacità informatica all’interno del nostro Readiness Framework”, l’azienda prevede di portare utenti selezionati a testare le proprie capacità di sicurezza. (ApriAI Quadro di preparazione Per misurare e monitorare i potenziali danni agli esseri umani causati dall’intelligenza artificiale)

“I team di sicurezza potrebbero dover affrontare limitazioni quando tentano di impersonare gli autori delle minacce, analizzare malware per supportare la riparazione o sottoporre a stress test le infrastrutture critiche. Stiamo sviluppando un progetto pilota di accesso affidabile per eliminare questo conflitto per utenti e organizzazioni qualificati e consentire ai difensori fidati di utilizzare le capacità informatiche dell’intelligenza artificiale all’avanguardia per accelerare la difesa informatica”. OpenAI ha detto.

Limiti dell’agente

Già GPT-5.2 ha ricevuto elogi dagli utenti da utilizzare nelle attività e nei flussi di lavoro aziendali. Con la versione del Codex, alcune di queste funzionalità sono trasferibili, soprattutto perché le organizzazioni intendono utilizzare il modello per codificare i propri agenti.

La società ha affermato che il modello migliora il funzionamento a lungo termine attraverso la compressione e offre prestazioni elevate in caso di modifiche estese del codice. Offre anche prestazioni migliorate su Windows.

Nel test benchmark, GPT-5.2-Codex ha mostrato le migliori prestazioni in termini di precisione rispetto alle versioni precedenti.

"Con questi miglioramenti, Codex è diventato più capace di operare su grandi archivi di dati su lunghe sessioni con l’intero contesto intatto. Può completare attività complesse come refactoring importanti, migrazioni di codice e creazione di funzionalità in modo più affidabile; può continuare a ripetere senza perdere traccia anche quando i piani cambiano o le iniziative falliscono," OpenAI ha detto.

Dal suo lancio Anteprime a maggioCodex ha contribuito a introdurre la codifica mediata e interlacciata nello spazio dei generatori di intelligenza artificiale aziendale. Insieme a Windsurf, Cursor, Claude Code e molti degli agenti di codifica di Google, la piattaforma ha spostato i LLM dal semplice completamento del codice alla creazione e al lancio di progetti di codifica asincroni per gli utenti.

Collegamento alla fonte