Negli ultimi tre mesi, il Gemini 3 Pro di Google è rimasto uno dei flagship più capaci disponibili. Ma nel mondo in rapida evoluzione dell’intelligenza artificiale, tre mesi sono una vita e i concorrenti non stanno fermi.

Oggi, Google ha rilasciato quanto segue: Gemelli 3.1 ProSi tratta di un aggiornamento che introduce un’innovazione significativa nel modello di forte potere dell’azienda: tre livelli di pensiero regolabili che lo trasformano di fatto in una versione leggera del sistema di ragionamento Deep Think proprietario di Google.

Questa versione è la prima volta che Google ha un file "primo punto" L’aggiornamento al modello Gemini segnala un cambiamento nella strategia di rilascio dell’azienda da lanci periodici della versione completa ad aggiornamenti incrementali più frequenti. Ancora più importante per i team di intelligenza artificiale aziendali che valutano gli stack di modelli, il nuovo sistema di pensiero a tre livelli di 3.1 Pro (basso, medio e alto) fornisce agli sviluppatori e ai leader IT un unico modello in grado di scalare dinamicamente gli sforzi di ragionamento, dalle risposte rapide per le domande di routine alle sessioni di ragionamento approfondito di più minuti per problemi complessi.

Il modello è attualmente disponibile in anteprima sulle API Gemini: Studio sull’intelligenza artificiale di GoogleGemini CLI, la piattaforma di sviluppo agenti di Google Antigravity, Vertex AI, Gemini Enterprise, Android Studio, l’app consumer Gemini e NotebookLM.

Effetto ‘Deep Think Mini’: ragionamento personalizzabile

Il punto forte del Gemini 3.1 Pro non è un singolo numero di riferimento; Introduce un sistema di pensiero a tre livelli che offre agli utenti un controllo dettagliato sulla quantità di sforzo computazionale che il modello inserisce in ciascuna risposta.

Il Gemini 3 Pro offriva solo due modalità di pensiero: bassa e alta. Il nuovo 3.1 Pro aggiunge un’impostazione media (simile alla precedente impostazione alta) e, soprattutto, "alto" veicolo. Se impostato su Alto 3.1 Pro è a "Versione mini di Gemini Deep Think" — il modello di ragionamento specifico dell’azienda appena aggiornato la settimana scorsa.

L’impatto della distribuzione aziendale può essere significativo. Invece di instradare le richieste a diversi modelli personalizzati in base alla complessità dell’attività (un modello comune ma operativamente oneroso), le organizzazioni possono ora utilizzare un singolo endpoint del modello e adattare la profondità del ragionamento in base all’attività da svolgere. Il riepilogo di routine dei documenti può essere effettuato con un pensiero di basso livello con tempi di risposta rapidi, mentre compiti analitici complessi possono essere elevati a un pensiero di alto livello per un ragionamento di livello Deep Thinking.

Prestazioni comparative: più del doppio del giudizio rispetto al 3 Pro

I benchmark pubblicati da Google raccontano una sorprendente storia di miglioramento, soprattutto negli ambiti legati alla capacità di ragionamento e di mediazione.

Aprire ARC-AGI-23.1 Punteggio Pro, un benchmark che valuta la capacità di un modello di risolvere nuovi modelli di ragionamento astratto 77,1% — Più del doppio del 31,1% raggiunto dal Gemini 3 Pro e ben davanti a Sonnet 4.6 di Anthropic (58,3%) e Opus 4.6 (68,8%). Questo risultato fa impallidire anche il GPT-5.2 di OpenAI (52,9%).

I guadagni sono diffusi. Aprire L’ultima prova dell’umanità3.1 Pro, una misura rigorosa del giudizio accademico, ha ottenuto il 44,4% senza strumenti; Per 3 Pro è stato del 37,5%, davanti sia a Claude Sonnet 4.6 (33,2%) che a Opus 4.6 (40,0%). Aprire Diamante GPQAIn una valutazione scientifica, 3.1 Pro ha ottenuto il 94,3%, superando tutti i concorrenti elencati.

Il punto in cui i risultati diventano particolarmente significativi per i team di intelligenza artificiale aziendale è nei benchmark intermediati; Le valutazioni che misurano il rendimento dei modelli quando vengono forniti strumenti e attività in più fasi sono il tipo di lavoro che definisce sempre più le implementazioni dell’intelligenza artificiale nella produzione.

Aprire Banco di lavoro terminale 2.0Valutando la codifica del terminale dell’agente, 3.1 Pro ha ottenuto un punteggio del 68,5% rispetto al 56,9% del modello precedente. Aprire Atlante MCP3.1 Pro, un benchmark che misura i flussi di lavoro in più fasi utilizzando il Model Context Protocol, ha raggiunto il 69,2%; Si tratta di un miglioramento di 15 punti rispetto al 54,1% del 3 Pro e quasi 10 punti di vantaggio sia su Claude che su GPT-5.2. Poi SfogliaCompTestando la capacità di ricerca web mediata, il 3.1 Pro ha raggiunto l’85,9%, battendo il 59,2% del 3 Pro.

Perché Google ha scelto la versione “0.1” e cosa indica questo?

La decisione stessa sul controllo delle versioni è degna di nota. Le versioni precedenti di Gemini seguivano un modello legacy di anteprime, come più anteprime 2.5, prima della disponibilità generale. L’opzione di designare questo aggiornamento come 3.1 anziché come un’altra anteprima di 3 Pro suggerisce che Google considera i miglioramenti abbastanza importanti da giustificare un aumento della versione. "primo punto" Il framing crea aspettative secondo cui si tratta di un’evoluzione, non di una rivoluzione.

Il post sul blog di Google afferma che 3.1 Pro si basa direttamente sulle lezioni apprese dalla serie Gemini Deep Think e combina tecniche delle versioni precedenti e più recenti. I confronti suggeriscono fortemente che l’apprendimento per rinforzo gioca un ruolo centrale nei guadagni, in particolare in compiti come ARC-AGI-2, parametri di codifica e valutazioni delle azioni (precisamente aree in cui gli ambienti di formazione basati su RL possono fornire chiari segnali di ricompensa).

Il modello viene rilasciato in anteprima anziché come lancio di disponibilità generale e Google sottolinea che continuerà a fare progressi in aree come i flussi di lavoro mediati prima di passare alla versione GA completa.

Implicazioni competitive per lo stack AI aziendale

Il lancio di Gemini 3.1 Pro dovrebbe indurre i decisori IT che valutano i principali fornitori di modelli a riconsiderare non solo quali modelli scegliere, ma anche come adattarsi a cambiamenti così rapidi per i propri prodotti e servizi.

La domanda ora è se questo rilascio scatenerà una reazione da parte dei concorrenti. Il lancio originale di Gemini 3 Pro lo scorso novembre ha lanciato un’ondata di rilasci di modelli sia negli ecosistemi proprietari che in quelli aperti.

Con 3.1 Pro che riconquista la leadership nei benchmark in diverse categorie critiche, c’è pressione su Anthropic, OpenAI e la comunità openweight affinché rispondano, e nell’attuale panorama dell’IA tale risposta è probabilmente misurata in settimane anziché in mesi.

disponibilità

Gemini 3.1 Pro è ora disponibile in anteprima API Gemelli in Google AI Studio, Gemini CLI, Google Antigravity e Android Studio per gli sviluppatori. I clienti aziendali possono accedervi all’indirizzo: IA del vertice E Gemelli Aziendale. I consumatori con piani Google AI Pro e Ultra possono accedervi tramite l’app Gemini e NotebookLM.

Collegamento alla fonte