Alla fine dell’anno scorso, Google ha conquistato brevemente la corona del modello di intelligenza artificiale più potente al mondo con il rilascio di Gemini 3 Pro; ma è stato superato nel giro di poche settimane quando OpenAI e Anthropic hanno rilasciato nuovi modelli; Questo è comune nella gara fortemente competitiva dell’IA.
Ora Google è tornato per reclamare il trono versione aggiornata del modello di punta: Gemini 3.1 Proposizionato come base più intelligente per compiti per i quali una risposta semplice è inadeguata; Si è concentrato sui flussi di lavoro scientifici, di ricerca e di ingegneria che richiedono una pianificazione e una sintesi approfondite.
Già, Valutazioni effettuate da una società terza Artificial Analysis Ciò dimostra che Gemini 3.1 Pro di Google si distingue ed è ancora una volta il modello AI più potente e performante al mondo.
Un enorme passo avanti nel ragionamento di base
Il miglioramento più significativo di Gemini 3.1 Pro risiede nelle sue prestazioni su rigorosi benchmark logici. Ancora più importante, il modello ha ottenuto un punteggio convalidato del 77,1% su ARC-AGI-2.
Questo particolare benchmark è progettato per valutare la capacità di un modello di risolvere schemi logici completamente nuovi che non ha incontrato durante l’addestramento.
Questo risultato rappresenta più del doppio della prestazione di giudizio del precedente modello Gemini 3 Pro.
Al di là della logica astratta, i benchmark interni mostrano che il 3.1 Pro è abbastanza competitivo in aree specifiche:
-
Informazioni scientifiche: Ha ottenuto un punteggio del 94,3% al GPQA Diamond.
-
Codifica: Ha ottenuto un Elo di 2887 in LiveCodeBench Pro e ha ottenuto un punteggio dell’80,6% in SWE-Bench Verified.
-
Comprensione multimodale: Ha raggiunto il 92,6% in MMMLU.
Questi vantaggi tecnici non sono meramente incrementali; rappresentano un miglioramento nel modo in cui viene trattato il modello "pensiero" I token e le attività a lungo termine forniscono una base più affidabile per gli sviluppatori che creano agenti autonomi.
Codifica delle vibrazioni e sintesi 3D migliorate
Google dimostra i vantaggi del modello come segue: "intelligenza applicata"—Spostare l’attenzione dalle interfacce di chat agli output funzionali.
Una delle caratteristiche più distintive del modello è la sua capacità di produrre. "vibrazione codificata" SVG animati direttamente da istruzioni di testo. Poiché sono basati su codice anziché su pixel, rimangono scalabili e mantengono dimensioni di file ridotte rispetto ai video tradizionali; Forniscono immagini più dettagliate, presentabili e professionali per siti Web, presentazioni e altre applicazioni aziendali.
Altre app in mostra includono:
-
Sintesi di sistemi complessi: Il modello ha configurato con successo un flusso di telemetria disponibile al pubblico per creare un dashboard aeronautico in tempo reale che visualizzasse l’orbita della Stazione Spaziale Internazionale.
-
Progettazione interattiva: In una demo, il 3.1 Pro ha codificato un complesso mormorio storno 3D che gli utenti potevano elaborare tramite il tracciamento manuale, accompagnato da un memo vocale generativo.
-
Codifica creativa: La modella traduceva i temi atmosferici di Emily Brontë. Cime tempestose in un web design funzionale e moderno, dimostrando la capacità di ragionare attraverso il tono e lo stile piuttosto che il semplice testo letterale.
Impatto aziendale e risposte della comunità
I partner aziendali hanno iniziato a integrare la versione di anteprima di 3.1 Pro e segnalano notevoli miglioramenti in termini di affidabilità ed efficienza.
Il direttore dell’intelligenza artificiale di JetBrains, Vladislav Tankov, ha dichiarato che c’è stato un aumento della qualità del 15% rispetto alle versioni precedenti e ha affermato che il modello è il seguente: "più potente, più veloce… e più efficiente, richiedendo meno token di uscita". Altre reazioni del settore includono:
-
Mattoncini dati: Il CTO Hanlin Tang riferisce che il modello ha raggiunto il successo "risultati migliori della categoria" In OfficeQA, un punto di riferimento per il ragionamento fondato tra dati tabulari e non strutturati.
-
Movimento del cerchio: Il co-fondatore Andrew Carr ha evidenziato il modello "Miglioramento significativo nella comprensione delle trasformazioni 3D," Ha affermato di aver risolto bug di ordine di rotazione di lunga data nelle pipeline di animazione 3D.
-
Orizzonti di Hostinger: Il responsabile del prodotto Dainius Kavoliunas ha osservato che il modello comprende: "vibrazione" dietro un prompt, traducendo l’intento in codice stilisticamente corretto per i non sviluppatori.
Prezzi, licenze e disponibilità
L’aspetto più sorprendente della versione 3.1 Pro per gli sviluppatori è "ragionare con il dollaro" rapporto. Al momento del lancio, Gemini 3 Pro si posizionava nella fascia di prezzo medio-alta con 2,00 dollari per milione di token di ingresso per richieste standard. Gemini 3.1 Pro mantiene esattamente questa struttura di prezzi, offrendo agli utenti API un importante aggiornamento delle prestazioni senza costi aggiuntivi.
-
Prezzo di ingresso: $ 2,00 per 1 milione di monete per richieste fino a 200.000; $ 4,00 per 1 milione di monete per richieste superiori a 200.000.
-
Prezzo di rilascio: $ 12,00 per 1 milione di monete per richieste fino a 200.000; $ 18,00 per 1 milione di monete per richieste superiori a 200.000.
-
Cache del contesto: Fatturato tra $ 0,20 e $ 0,40 per 1 milione di token a seconda delle dimensioni della richiesta, più una tariffa di archiviazione di $ 4,50 per 1 milione di token all’ora.
-
Ricerca messa a terra: 5.000 richieste al mese sono gratuite, quindi è prevista una tariffa di $ 14 per 1.000 query di ricerca.
Per i consumatori, il modello è disponibile sull’app Gemini e NotebookLM, con limiti più elevati per gli abbonati Google AI Pro e Ultra.
Effetti della licenza
Come modello speciale offerto tramite Studio Vertice GoogleNuvola E API Gemelli3.1 Pro segue un modello SaaS (Software as a Service) commerciale standard anziché una licenza open source.
Per gli utenti aziendali ciò fornisce: "ragionamento basato" Rientra nell’ambito di sicurezza di Vertex AI e consente alle aziende di lavorare in sicurezza sui propri dati.
"Anteprima" Questa situazione consente a Google di perfezionare la sicurezza e le prestazioni del modello prima che venga rilasciato al grande pubblico, una pratica comune nell’implementazione dell’IA ad alto rischio.
Raddoppiando il ragionamento di base e i benchmark specializzati come ARC-AGI-2, Google sta segnalando che la prossima fase della corsa all’intelligenza artificiale sarà vinta da modelli in grado di riflettere su un problema, non solo di prevedere la parola successiva.















