GPT-5 è l’ultima versione del Big Language di Openai

Immagini Cheng Shin/Getty

L’ultimo passo dell’intelligenza artificiale non ha un enorme salto come rimpasto temporaneo. Openai ha rilasciato il suo ultimo modello AI, GPT -5Due anni dopo aver rotolato il GPT-4, il cui successo ha operato le chiacchiere verso il dominio del mondo. Ma nonostante le promesse di un salto uniforme in capacità, GPT -5 mostra un po ‘di miglioramento su altri principali modelli di intelligenza artificiale, indicando che l’industria potrebbe richiedere un nuovo approccio per creare un sistema di intelligenza artificiale più intelligente.

Le dichiarazioni di Openai mostrano il GPT-5 come “salto significativo nell’intelligenza” dai precedenti modelli dell’azienda, mostrano chiari miglioramenti nel GPT-5, programmazione, matematica, scrittura, informazioni sulla salute e comprensione visiva. Promette allucinazioni meno frequenti, che si verificano quando un’intelligenza artificiale considera le informazioni false vere. Con un punto di riferimento interno che misura “lavori di conoscenza complessi e economicamente preziosi”, Openai afferma che GPT, 5 “è migliore degli esperti in circa la metà dei casi o meglio … in oltre 40 aziende diffuse in oltre 40 aziende tra cui legge, logistica, vendite e ingegneria”.

Tuttavia, le prestazioni di GPT -5 sui benchmark pubblici non sono migliori dei modelli chiave di altre società di intelligenza artificiale, come la nuvola di antropici o gemelli di Google. È migliorato su GPT-4, ma la differenza per molti parametri di riferimento è più piccola del salto da GPT-3 a GPT-4. Molti clienti di Chatgpt hanno anche Non è influenzatoCon esempi di GPT-5, non sono riusciti a rispondere a semplici domande che ricevono ampia attenzione sui social media.

“Molte persone speravano che ci sarebbe stato un successo, e questo non è un successo”, Mirala lapata All’Università di Edimburgo, in Gran Bretagna. “Questo è un aggiornamento e sembra una miseria.”

Le misure più complete delle prestazioni di GPT-5 provengono da Openi, in quanto è solo un accesso completo al modello. Alcuni dettagli sui benchmark interni sono stati resi pubblici, dice Anna Rogers All’università IT, Copenaghen in Danimarca. “Pertanto, questo non è qualcosa che può essere seriamente discusso come un’affermazione scientifica.”

In un briefing stampa prima del lancio del modello, Altman ha affermato che “GPT -5 è la prima volta che sembra parlare con uno specialista in qualsiasi argomento come un esperto di dottorato”. Royers dice, ma non è supportato dal punto di riferimento e non è chiaro come un dottorato sia generalmente correlato all’intelligenza. “Le persone altamente intelligenti non hanno un diploma di dottorato e non vi è alcuna garanzia di alta intelligenza dall’avere una tale laurea.”

Chiaramente minori miglioramenti di GPT-5 possono essere un segno di difficoltà diffuse per gli sviluppatori di intelligenza artificiale. Fino a qualche tempo fa, si pensava che modelli di linguaggio così grandi (LLM) fossero più capaci con più dati di addestramento e potenza del computer. Sembra che non sia più nato dai risultati degli ultimi modelli e le aziende non hanno trovato progetti di sistema di intelligenza artificiale migliori rispetto a quelli che hanno gestito il chatgpt. “Ognuno ha solo una ricetta e sappiamo quale sia la ricetta”, afferma Lapata, riferendosi al processo di pre-allenamento con grandi quantità di dati e quindi apportati regolazioni con i processi dopo la formazione successiva.

Tuttavia, è difficile dire quanto siano vicini gli LLM, perché non sappiamo come siano progettati modelli come GPT -5. Nicos Altras All’Università di Sheffield, in Gran Bretagna. “(Se o se) cercando di generalizzare (se) il modello di grande lingua ha colpito un muro.

Openi sta lavorando su altri metodi per rendere il suo prodotto più efficiente, come il nuovo sistema di routing di GPT-5. A differenza degli esempi precedenti di CHATGPT, in cui le persone possono scegliere che devono essere utilizzati i modelli di intelligenza artificiale, GPT-5 ora scansiona le richieste e le dirige in un modello specifico che utilizzerà la quantità appropriata di potenza computazionale.

Lapata afferma che questo approccio può essere adottato in modo più ampio. “I modelli logici usano molto (calcolo) e richiede tempo e denaro”, dicono. “Se puoi rispondere con un piccolo modello, vedremo di più in futuro.” Ma la mossa ha fatto arrabbiare alcuni clienti di chat, che ispirano Altman a dire La compagnia sta guardando Per migliorare il processo di routing.

Ci sono segni più positivi in un modello aperto separato per il futuro dell’IA, che ha raggiunto i punteggi delle medaglie d’oro nelle competizioni matematiche e di codifica d’élite nell’ultimo mese, qualcosa che i migliori modelli di AI non potrebbero fare un anno fa. Mentre i dettagli di come funzionano i modelli sono di nuovo spaventati, I dipendenti di Openi hanno Ha detto che il suo successo mostra che il sistema ha capacità logiche più generali.

Queste competizioni sono utili per i test sui dati che non hanno visto durante la loro formazione, chiamando Elatras, ma sono ancora ristretti test di intelligenza. Aumentare le prestazioni di un modello in una regione può anche peggiorare gli altri, dicendo lapata, che può essere difficile mantenere la traccia.

Una regione in cui GPT-5 è migliorata in modo significativo CostaChe è ora più economico di altri modelli, il miglior modello cloud di antropico, ad esempio, Circa 10 volte di più Per elaborare lo stesso numero di richieste al momento della stesura. Ma può presentare i suoi problemi a lungo termine, se il reddito di OpenI non copre gli enormi costi fatti per creare ed eseguire nuovi data center. “Il prezzo è pazzo. È così economico che non so come possano tollerarlo”, afferma Lapata.

La concorrenza tra il modello di AI principale è terribile, soprattutto con l’aspettativa che il primo modello da estrarre dagli altri prenderà la maggior parte della partecipazione sul mercato. “Tutte queste grandi aziende, stanno cercando di diventare un vincitore ed è difficile”, afferma Lapata. “Sei un vincitore per tre mesi.”

Soggetto:

Collegamento alla fonte