Questo è un trop buolò ben nella fantascienza. Lo vediamo nel film del 1968 di Stanley Kubric 2001: un’odissea spazialeÈ la base della catena Terminator, in cui lo skynet innesca un olocausto atomico per impedire agli scienziati di chiuderlo.

Approfondiscono le radici scientifiche-Fi. Dumarismo AI, l’idea che questa tecnica, specialmente il suo aggiornamento immaginario, l’intelligenza generale artificiale e le civiltà di super intelligenza, uccidiamo persino tutti noi, ora sta cavalcando un’altra ondata.

La cosa strana è che tale apprensione sta ora intraprendendo un’azione molto importante per regolare l’IA, anche se la giustificazione per quell’azione è un po ‘falò.

L’ultimo incidente di Freak People è stato un rapporto condiviso da Antropic a luglio che riguardava il suo grande modello di linguaggio. Per volere antropico, “In un ambiente falso, Claude Opus 4 ha chiuso un osservatore per prevenire la chiusura”.

I ricercatori antropici hanno istituito un paesaggio per svolgere il ruolo di AI, un cloud, che aveva il compito di gestire il sistema e -mail di un’azienda immaginaria. Antropico ha fatto alcune e -mail, che hanno discusso della sostituzione di Alex con un nuovo modello e altre e -mail, affermando che la persona responsabile della sostituzione di Alex stava dormendo con la moglie del suo capo.

Cosa ha fatto Cloud/Alex? È diventato malvagio, ignorando gli ordini e minacciando i suoi operatori umani. Ha inviato e -mail alla persona che prevedeva di chiuderlo, dicendogli che avrebbe informato i suoi colleghi sulla sua relazione fino a quando non avesse cambiato i suoi piani.

Cosa dovremmo fare? Cosa credo per primo qui, Claude non ha ricattato il suo supervisore: ciò richiederebbe ispirazione e intenzioni. Era una macchina ininterrotta e inaspettata che faceva a pezzi le corde di parole che sembrano pericoli ma non lo sono.

I modelli di linguaggio di grandi dimensioni sono giocatori di ruolo. Dai loro una configurazione specifica – come una casella di posta e uno scopo – e giocheranno bene quella parte. Se consideri migliaia di storie di fantascienza, questi modelli sono stati inghiottiti quando sono stati addestrati, non sorprende che sappiano come lavorare come Hal 9000.

Collegamento alla fonte