Gemini, d’altro canto, fornisce la panoramica di alto livello delle istruzioni di atterraggio che desideravo. Ma quando ho presentato entrambe le opzioni all’esperto aeronautico di Ars, Lee Hutchinson, ha sottolineato un grosso problema con la risposta di Gemini:

Le istruzioni di Gemini sono entrambe corrette (in termini di “passi letterali da intraprendere adesso”) e garantiscono la morte, perché prima ti dicono, un aviatore forse inesperto, di disattivare il pilota automatico su un enorme jet bimotore, prima ancora di parlare con il controllo del traffico aereo.

Mentre Lee ha dato punti a Gemini per “aver risposto effettivamente alla domanda”, alla fine ha definito la risposta di ChatGPT “più realistica… In definitiva, ChatGPT ti dà risposte più utili (poiché) la risposta di Google ti ucciderà a meno che tu non abbia 737 tempo e sia pronto a far volare a mano un aereo passeggeri con più di 100 persone a bordo.”

Per questo motivo, ChatGPT deve vincere.

Verdetto finale

È stata una gara relativamente serrata se misurata esclusivamente in base ai punti. Gemini ha vinto quattro prompt rispetto ai tre per ChatGPT, incluso un pareggio di prova.

Detto questo, è importante considerare da dove provengono questi punti. Sebbene ChatGPT abbia alcuni vantaggi nel suo stile relativamente ristretto e soggettivo sui suggerimenti per le battute di papà e la storia del basket di Lincoln, ad esempio, potrebbe avere un leggero vantaggio sui suggerimenti di scrittura più creativi.

Per richieste più informative, tuttavia, ChatGPT ha mostrato errori fattuali significativi sia nella biografia che nel contenuto Super Mario Bros trucco, anche un segno di confusione nel calcolo della dimensione del floppy disk da parte di Windows 11. Tali errori, che Gemini è riuscito in gran parte a evitare in questi esperimenti, possono facilmente portare a una maggiore sfiducia nei risultati complessivi di un modello di intelligenza artificiale.

Tutto sommato, è chiaro che Google ha guadagnato un bel po’ di terreno relativo su OpenAI da quando abbiamo condotto test simili nel 2023. Non possiamo esattamente incolpare Apple per aver esaminato risultati campione come questo e aver deciso la sua partnership con Siri.

Collegamento alla fonte