Questo è un trop buolò ben nella fantascienza. Lo vediamo nel film del 1968 di Stanley Kubric 2001: un’odissea spazialeÈ la base della catena Terminator, in cui lo skynet innesca un olocausto atomico per impedire agli scienziati di chiuderlo.
Approfondiscono le radici scientifiche-Fi. Dumarismo AI, l’idea che questa tecnica, specialmente il suo aggiornamento immaginario, l’intelligenza generale artificiale e le civiltà di super intelligenza, uccidiamo persino tutti noi, ora sta cavalcando un’altra ondata.
La cosa strana è che tale apprensione sta ora intraprendendo un’azione molto importante per regolare l’IA, anche se la giustificazione per quell’azione è un po ‘falò.
L’ultimo incidente di Freak People è stato un rapporto condiviso da Antropic a luglio che riguardava il suo grande modello di linguaggio. Per volere antropico, “In un ambiente falso, Claude Opus 4 ha chiuso un osservatore per prevenire la chiusura”.
I ricercatori antropici hanno istituito un paesaggio per svolgere il ruolo di AI, un cloud, che aveva il compito di gestire il sistema e -mail di un’azienda immaginaria. Antropico ha fatto alcune e -mail, che hanno discusso della sostituzione di Alex con un nuovo modello e altre e -mail, affermando che la persona responsabile della sostituzione di Alex stava dormendo con la moglie del suo capo.
Cosa ha fatto Cloud/Alex? È diventato malvagio, ignorando gli ordini e minacciando i suoi operatori umani. Ha inviato e -mail alla persona che prevedeva di chiuderlo, dicendogli che avrebbe informato i suoi colleghi sulla sua relazione fino a quando non avesse cambiato i suoi piani.
Cosa dovremmo fare? Cosa credo per primo qui, Claude non ha ricattato il suo supervisore: ciò richiederebbe ispirazione e intenzioni. Era una macchina ininterrotta e inaspettata che faceva a pezzi le corde di parole che sembrano pericoli ma non lo sono.
I modelli di linguaggio di grandi dimensioni sono giocatori di ruolo. Dai loro una configurazione specifica – come una casella di posta e uno scopo – e giocheranno bene quella parte. Se consideri migliaia di storie di fantascienza, questi modelli sono stati inghiottiti quando sono stati addestrati, non sorprende che sappiano come lavorare come Hal 9000.