ZoomComunicazione videoL’azienda, nota per aver mantenuto connessi i lavoratori da remoto durante la pandemia, ha annunciato la scorsa settimana di aver ottenuto il punteggio più alto mai registrato in uno dei test più duri sull’intelligenza artificiale; Questa affermazione ha suscitato ondate di sorpresa, scetticismo e genuina curiosità nel settore tecnologico.
La società con sede a San Jose ha affermato che il suo sistema di intelligenza artificiale ha ottenuto ottimi risultati 48,1%. SU L’ultima prova dell’umanitàÈ un punto di riferimento progettato da esperti in materia di tutto il mondo per superare anche i modelli di intelligenza artificiale più avanzati. Questo risultato supera quello di Google Gemelli 3 ProHa mantenuto il record precedente con il 45,8%.
"Zoom ha ottenuto un nuovo risultato all’avanguardia sull’impegnativo benchmark completo di Humanity’s Last Test, ottenendo un punteggio del 48,1%; Ciò rappresenta un miglioramento significativo del 2,3% rispetto al precedente risultato SOTA." Il responsabile della tecnologia di Zoom, Xuedong Huang, ha scritto: Blog POST.
L’annuncio solleva una domanda provocatoria che preoccupa da giorni gli osservatori dell’intelligenza artificiale: come è riuscita a passare all’improvviso un’azienda di videoconferenze senza alcun track record pubblico nella formazione di grandi modelli linguistici? Google, OpenAIE antropico Con un benchmark costruito per misurare i limiti dell’intelligenza artificiale?
La risposta dice tanto sulla direzione in cui è diretta l’intelligenza artificiale quanto sugli obiettivi tecnici di Zoom. E a seconda di chi chiedi, questa è una magistrale dimostrazione di ingegneria pratica o un’affermazione vuota che dà credito al lavoro di altri.
In che modo Zoom ha sviluppato un controllore del traffico AI invece di addestrare il proprio modello?
Zoom non ha addestrato il proprio modello linguistico ampio. Invece, l’azienda ha sviluppato qualcosa di proprio. "approccio unificato all’intelligenza artificiale" – un sistema che instrada le query a più modelli esistenti di OpenAI, Google e Anthropic e quindi utilizza un software personalizzato per selezionare, combinare e perfezionare i relativi risultati.
Al centro di questo sistema c’è ciò che Zoom chiama “se stesso”. "Marcatore Z," Un meccanismo che valuta le risposte di diversi modelli e sceglie quello migliore per un determinato compito. L’azienda abbina questo a ciò che descrive come prodotto "strategia scopri-verifica-combina," Un flusso di lavoro mediato che bilancia il ragionamento esplorativo con la convalida su più sistemi di intelligenza artificiale.
"Il nostro approccio combinato combina i piccoli modelli linguistici di Zoom con modelli open source e closed source avanzati," Huang ha scritto. telaio "Organizza vari modelli per creare, mettere in discussione e sviluppare il ragionamento attraverso la collaborazione dialettica."
In termini più semplici: Zoom ha creato un controllore del traffico avanzato per l’intelligenza artificiale, non per l’intelligenza artificiale stessa.
Questa distinzione è estremamente importante in un settore in cui il diritto di vantarsi e le valutazioni multimiliardarie spesso dipendono da chi può vantare il modello più talentuoso. I grandi laboratori di intelligenza artificiale spendono centinaia di milioni di dollari per addestrare sistemi all’avanguardia su grandi cluster informatici. Il successo di Zoom, al contrario, sembra basarsi su un’integrazione intelligente dei sistemi esistenti.
Perché i ricercatori nel campo dell’intelligenza artificiale sono divisi su ciò che conta come vera innovazione?
La reazione della comunità dell’intelligenza artificiale è stata rapida e nettamente divisa.
Corpo massimoUn ingegnere dell’intelligenza artificiale che afferma di addestrare modelli linguistici all’avanguardia ha pubblicato una critica feroce sui social media. "Ha aggregato le chiamate API a Zoom, Gemini, GPT, Claude e altri. e leggermente migliorato rispetto a un benchmark che non offre alcun valore ai propri clienti," ha scritto. "Quindi richiedono SOTA."
Rumpf non ha rifiutato l’approccio tecnico in sé. Ha osservato che è importante utilizzare più modelli per compiti diversi. "In realtà è piuttosto intelligente e la maggior parte delle app dovrebbe farlo." Ha citato Sierra, una società di servizi clienti basata sull’intelligenza artificiale, come esempio di questa strategia multi-modello eseguita in modo efficace.
La sua obiezione era più specifica: "Non hanno addestrato il modello ma hanno nascosto questo fatto nel tweet. L’ingiustizia di prendersi il merito del lavoro altrui tocca profondamente le persone."
Ma altri osservatori hanno visto il successo in modo diverso. HongchengZhuUno sviluppatore ha offerto una valutazione più sobria: "Per completare la valutazione dell’intelligenza artificiale, probabilmente avrai bisogno di una federazione di modelli come fa Zoom. Un’analogia è che ogni concorrente di Kaggle sa che per vincere una competizione devi mettere insieme i modelli."
Per confrontare Kaggle La piattaforma competitiva di data science, in cui la combinazione di più modelli è una pratica standard tra i team vincenti, riformula l’approccio di Zoom come best practice del settore piuttosto che come un gioco di prestigio. La ricerca accademica ha da tempo stabilito che i metodi di insieme superano abitualmente i modelli individuali.
Tuttavia, il dibattito ha rivelato una linea di frattura nel modo in cui l’industria intende il progresso. Ryan PreamIl fondatore di Exoria AI è stato sprezzante: "Zoom crea un cablaggio attorno a un altro LLM e lo segnala. E’ solo rumore." Un altro commentatore ha notato che la notizia era del tutto inaspettata: "Lo sviluppo da parte dell’app di videoconferenza ZOOM di un modello SOTA che ha raggiunto il 48% di HLE non era sulla mia cartella bingo."
Forse la critica più acuta riguardava le priorità. Rumpf ha sostenuto che Zoom potrebbe indirizzare le proprie risorse verso i problemi effettivamente affrontati dai suoi clienti. "Accesso tramite trascrizioni delle chiamate “non risolte” da SOTA LLM" ha scritto. "Penso che gli utenti di Zoom si preoccuperanno di questo molto più che di HLE."
Il veterano di Microsoft punta la sua reputazione su un diverso tipo di intelligenza artificiale
Mentre il risultato del benchmark di Zoom sembrava provenire dal nulla, il suo chief technology officer no.
Xuedong Huang è arrivato a Zoom da Microsoft, dove ha trascorso decenni sviluppando le capacità di intelligenza artificiale dell’azienda. Ha fondato il gruppo di tecnologia vocale di Microsoft nel 1993 e ha guidato team che hanno raggiunto ciò che l’azienda descrive come parità umana nel riconoscimento vocale, nella traduzione automatica, nella comprensione del linguaggio naturale e nella visione artificiale.
Huang ha un dottorato di ricerca. in ingegneria elettrica presso l’Università di Edimburgo. È membro eletto dell’associazione. Accademia Nazionale di Ingegneria E Accademia americana delle arti e delle scienzeanche un amico di entrambe le parti IEEE E ACM. Le sue referenze lo collocano tra i dirigenti di intelligenza artificiale di maggior successo nel settore.
La sua presenza su Zoom segnala che le ambizioni dell’azienda in materia di intelligenza artificiale sono serie, anche se i suoi metodi differiscono da quelli dei laboratori di ricerca che dominano i titoli dei giornali. Nel suo tweet che celebra il risultato del benchmark, Huang ha definito il successo come una conferma della strategia di Zoom: "Superando i limiti prestazionali di un singolo modello, abbiamo sbloccato funzionalità più potenti nell’esplorazione, nel ragionamento e nella collaborazione multi-modello."
Quest’ultimo elemento – "superando i limiti prestazionali di qualsiasi modello" – potrebbe essere il più importante. Huang non sostiene che Zoom abbia costruito un modello migliore. Afferma che Zoom ha creato un sistema migliore per l’utilizzo dei modelli.
All’interno del test pensato per sorprendere le macchine più intelligenti del mondo
Il criterio al centro di questo dibattito è L’ultima prova dell’umanitàÈ stato progettato per essere estremamente difficile. A differenza dei test precedenti in cui i sistemi di intelligenza artificiale imparavano a giocare attraverso il pattern match, l’HLE presenta problemi che richiedono una vera comprensione, un ragionamento in più fasi e una sintesi della conoscenza in ambiti complessi.
L’esame si basa su domande poste da esperti di tutto il mondo, che coprono aree che vanno dalla matematica avanzata alla filosofia e alle conoscenze scientifiche specializzate. Un punteggio del 48,1% potrebbe non sembrare impressionante a chi è abituato alle curve dei voti scolastici, ma nel contesto dell’HLE questo rappresenta l’attuale limite massimo delle prestazioni della macchina.
"Questo benchmark è stato sviluppato da esperti in materia di tutto il mondo ed è diventato una metrica cruciale per misurare i progressi dell’IA verso prestazioni di livello umano in compiti intellettuali impegnativi." L’annuncio di Zoom ha attirato l’attenzione.
Il miglioramento del 2,3% dell’azienda rispetto al record precedente di Google potrebbe sembrare modesto di per sé. Tuttavia, un salto del genere attira l’attenzione nel confronto competitivo, dove i guadagni sono spesso ottenuti per frazioni percentuali.
Cosa rivela l’approccio di Zoom sul futuro dell’intelligenza artificiale aziendale?
L’approccio di Zoom ha implicazioni che vanno ben oltre le classifiche dei benchmark. L’azienda segnala una visione fondamentalmente diversa dalle strategie incentrate sul modello perseguite per l’intelligenza artificiale aziendale. OpenAI, antropicoE Google.
Invece di investire tutto nella costruzione del singolo modello più capace, Zoom si posiziona come un livello di orchestrazione; un’azienda in grado di integrare le migliori capacità di più fornitori e di fornirle attraverso prodotti che le aziende già utilizzano ogni giorno.
Questa strategia protegge da un’incertezza critica nel mercato dell’intelligenza artificiale: nessuno sa quale modello sarà il migliore il mese prossimo, per non parlare dell’anno prossimo. Creando un’infrastruttura in grado di passare da un fornitore all’altro, Zoom evita il vincolo del fornitore, offrendo teoricamente ai clienti la migliore intelligenza artificiale disponibile per qualsiasi attività.
annuncio GPT-5.2 di OpenAI Il giorno dopo ha evidenziato questa dinamica. La comunicazione stessa di OpenAI seleziona Zoom come partner che valuta le prestazioni del nuovo modello "Hanno riscontrato vantaggi misurabili nei carichi di lavoro IA." In altre parole, Zoom è sia cliente di laboratori leader che ora concorrente nei test benchmark che utilizzano le proprie tecnologie.
Questa soluzione potrebbe essere sostenibile. I grandi fornitori di modelli hanno tutti gli incentivi a vendere ampiamente l’accesso alle API, anche alle aziende che possono aggregare la loro produzione. La domanda più interessante è se le capacità di orchestrazione di Zoom costituiscano un’autentica proprietà intellettuale o semplicemente una complessa ingegneria tempestiva che altri possono copiare.
Il vero test arriva quando i 300 milioni di utenti di Zoom iniziano a fare domande
Zoom ha chiamato la sua sezione degli annunci relazioni industriali "Un futuro collaborativo," e Huang ha scritto note di gratitudine ovunque. "Il futuro dell’intelligenza artificiale è collaborativo, non competitivo." ha scritto. "Combinando le migliori innovazioni del settore con le scoperte della nostra ricerca, creiamo soluzioni che sono superiori alla somma delle loro parti."
Questo quadro posiziona Zoom come un utile integratore, riunendo il miglior lavoro del settore a vantaggio dei clienti aziendali. I critici vedono qualcos’altro: un’azienda che rivendica il prestigio del suo laboratorio di intelligenza artificiale senza svolgere la ricerca di base che gli è valsa.
Il dibattito sarà probabilmente risolto sulla base dei prodotti, non delle classifiche. Quando Assistente AI 3.0 Quando raggiungerà le centinaia di milioni di utenti di Zoom nei prossimi mesi, prenderanno le proprie decisioni se il riepilogo della riunione riflette ciò che conta davvero, se le azioni da intraprendere hanno senso, se l’intelligenza artificiale fa risparmiare tempo o lo fa sprecare, non sulla base di parametri di riferimento di cui non hanno mai sentito parlare prima.
Di conseguenza, l’affermazione più provocatoria di Zoom potrebbe non essere quella di superare un benchmark. Questa potrebbe essere l’argomentazione implicita secondo cui nell’era dell’intelligenza artificiale, il modello migliore non è quello che crei, ma quello che sai come utilizzare.















