Nel frattempo, la forte prestazione di Scale AI nelle multisfide audio significa che il nuovo modello Gemini è più capace di gestire esitazioni e interruzioni nell’input audio. Sebbene surclassi altri modelli audio in tempo reale, Gemini 3.1 Flash Live ha ottenuto solo il 36,1% in questo test. I modelli audio che non sono progettati per gestire le conversazioni possono raggiungere punteggi superiori al 50% nella sfida multipla.
Il risultato è che Gemini 3.1 Flash Live dovrebbe suonare come una persona, al punto che Google ha ritenuto che fosse giunto il momento di integrare i flag AI. Gli output di questo modello conterranno la filigrana SynthID, che non è percepibile dagli ascoltatori umani. Tuttavia, se qualcuno cerca di far passare il discorso dell’intelligenza artificiale Gemini per un vero affare, può essere rilevato.
Google ha collaborato con Home Depot, Verizon e altre società per testare il modello. 3.1 Hanno tutti post di blog entusiastici su quanto bene Flash Live possa simulare il linguaggio umano. Quindi il prossimo assistente AI che incontrerai durante una telefonata potrebbe sembrare molto più realistico. Potresti anche pensare che stai parlando con una persona e SynthID non può farci niente.
Gli sviluppatori possono ora accedere al modello in AI Studio, Gemini API e Gemini Enterprise per l’esperienza del cliente. Quest’ultimo è fondamentalmente un kit di strumenti per l’acquisto di agenti. Gemini 3.1 Flash Live può essere visto in modo più evidente in Gemini Live e Search Live (una funzionalità della modalità AI). La nuova intelligenza artificiale conversazionale verrà implementata su questi prodotti a partire da oggi.















