Un altro giorno, un altro modello di intelligenza artificiale di Google. Google ha recentemente sviluppato nuovi strumenti di intelligenza artificiale, avendo appena rilasciato Gemini 3 a novembre. Oggi porta il modello di punta alla versione 3.1. nuovo Gemelli 3.1 Pro Lanciato oggi (in anteprima) per sviluppatori e consumatori, promette capacità avanzate di ragionamento e risoluzione dei problemi.

Google ha annunciato miglioramenti al suo strumento Deep Think la scorsa settimana e, a quanto pare, la “core intelligence” dietro quell’aggiornamento era Gemini 3.1 Pro. Come al solito, l’annuncio dell’ultimo modello di Google arriva con una serie di benchmark che mostrano per lo più miglioramenti modesti. Nel popolare Humanity’s Last Exam, che mette alla prova le conoscenze avanzate specifiche del dominio, il Gemini 3.1 Pro ha ottenuto un record del 44,4%. Gemini 3 Pro ha ottenuto il 37,5%, mentre GPT 5.2 di OpenAI ha ottenuto il 34,5%.

Google parla anche di miglioramenti al modello ARC-AGI-2A, che include nuovi problemi logici che non possono essere addestrati direttamente sull’intelligenza artificiale. Il Gemini 3 è rimasto indietro in questa valutazione, raggiungendo solo il 31,1%, rispetto ai punteggi degli anni ’50 e ’60 dei modelli concorrenti. Gemini 3.1 Pro raddoppia il punteggio di Google, raggiungendo un massimo del 77,1%.

Google è spesso felice quando rilascia nuovi modelli che hanno già raggiunto il top l’arena Classifica (precedentemente LM Arena), ma non questa volta. Per quanto riguarda il testo, Claude Opus 4.6 batte il nuovo Gemini di quattro punti a 1504. Per quanto riguarda il codice, Opus 4.6, Opus 4.5 e GPT 5.2 High sono tutti leggermente avanti rispetto a Gemini 3.1 Pro. Vale la pena notare che la classifica dell’Arena è alimentata da Vibes. Gli utenti votano i loro risultati preferiti, che possono essere premiati indipendentemente da ciò che sembra corretto.

Collegamento alla fonte