La vittoria di AlphaGo trasmessa in TV

Sono Hun-jung/Yonhap/AP Photo tramite Getty Images

Nel marzo 2016, il sistema di intelligenza artificiale AlphaGo di Google DeepMind ha scioccato il mondo. In una spettacolare serie di cinque partite dell’antico gioco da tavolo cinese, Go, un’intelligenza artificiale ha sconfitto il miglior giocatore del mondo, Lee Sedol: un momento che è stato trasmesso a milioni di persone e salutato da molti come un momento fondamentale nello sviluppo dell’intelligenza artificiale.

Chris MadisonJoe, ora professore di intelligenza artificiale all’Università di Toronto, all’epoca era uno studente di master e contribuì a far decollare il progetto. Tutto è iniziato quando Ilya Sutskever, che in seguito fondò OpenAI, entrò in contatto con…

Alex Wilkins: Come è nata l’idea di AlphaGo?

Chris Madison: Ilya (Satskever) mi ha fornito la seguente argomentazione sul perché dovremmo lavorare su Go. Ha detto: Chris, pensi che quando un giocatore esperto guarda il tabellone Go, possa scegliere la mossa migliore in mezzo secondo? Se pensi che possano farlo, significa che puoi imparare un’ottima politica per scegliere la mossa migliore utilizzando una rete neurale.

Questo perché mezzo secondo corrisponde all’incirca al tempo impiegato dalla corteccia visiva per eseguire un passaggio in avanti (un ciclo di elaborazione) e sapevamo già da ImageNET (un’importante competizione di riconoscimento delle immagini AI) che siamo molto bravi a indovinare cose che richiedono solo un passaggio in avanti della corteccia visiva.

Ho capito questa logica, quindi ho deciso di unirmi a (Google Brain) come stagista nell’estate del 2014.

Come si è evoluto AlphaGo da lì?

Quando mi sono unito, c’era un altro piccolo team in DeepMind con cui avrei lavorato, ovvero Aja Huang e David Silver, che avevano iniziato a lavorare su Go. Fondamentalmente il mio compito era iniziare a costruire reti neurali. era un sogno.

Abbiamo provato molti approcci diversi e molte delle prime cose che abbiamo provato hanno fallito. Alla fine, mi sono sentito frustrato e ho provato la cosa più stupida e semplice, ovvero provare a prevedere la mossa successiva che un esperto avrebbe fatto in una determinata posizione sul tabellone, addestrando una rete neurale su un ampio insieme di giochi esperti. E questo si è rivelato l’approccio che ci ha davvero fatto decollare.

Verso la fine dell’estate, abbiamo ospitato una piccola partita con Thor Greipel di DeepMind, che si considerava un buon giocatore di Go, e la mia rete lo ha sconfitto. Poi DeepMind ha iniziato a credere che sarebbe diventata una cosa reale e ha iniziato a investire risorse e a costruire una grande squadra attorno ad esso.

Quanto è stata difficile la sfida sconfiggere Lee Sedol?

Ricordo che nell’estate del 2014 c’era una foto di Lee Sedol praticamente sul tavolo accanto a noi. Io non sono un giocatore di Go, ma Aja (Huang) lo è. Ogni volta che creo una nuova rete, migliorerà un po’, e mi rivolgerò ad AJA e dirò, OK, siamo un po’ migliori, quanto siamo vicini a Lee Sedol? E Aja si girava verso di me e diceva: Chris, non capisci. Lee Sedol è una pietra di Dio.

Hai lasciato il team AlphaGo prima del grande evento. Perché?

David (Silver) ha detto che vogliamo trattenerti e portare davvero questo progetto al livello successivo e, ripensandoci, è stata probabilmente una delle decisioni più stupide che ho preso, l’ho rifiutato. Ho detto che penso che dovrei concentrarmi sul mio dottorato di ricerca, in fondo sono un accademico. Sono tornato per il dottorato e da quel momento in poi mi sono consultato liberamente con il progetto. Sono un po’ orgoglioso di dire che ci hanno messo un po’ a sconfiggere la mia rete neurale. Ma alla fine, l’opera d’arte riprodotta da Lee Sedol è stata il prodotto di un enorme sforzo ingegneristico e di una grande squadra.

Com’era l’atmosfera a Seul quando AlphaGo ha vinto?

Essere a Seoul in quel momento era difficile da esprimere. È stato emozionante. È stato intenso. C’era un sentimento di preoccupazione. Cammini con sicurezza, ma non lo sai mai. È come un gioco di sport. Statisticamente parlando, sei il giocatore migliore, ma non sai mai quale sarà il risultato. Ricordo che ero nell’hotel dove giocammo la partita e guardai fuori dalla finestra. Eravamo a un livello abbastanza alto da poter ammirare una delle piazze principali della città. Mi sono accorto che c’era un grande schermo come Times Square su cui veniva trasmessa la nostra partita. E poi ho guardato sui marciapiedi, la gente era in fila a guardare gli schermi. Ho sentito che milioni di persone hanno guardato la prima partita in Cina, ma ricordo che quel momento è stato come, Oh mio Dio, abbiamo davvero fermato l’Asia orientale sul suo cammino.

Quanto è stato importante AlphaGo per l’intelligenza artificiale in generale?

Molto è cambiato a livello superficiale nel mondo dei modelli linguistici di grandi dimensioni (LLM), ora sono abbastanza diversi in qualche modo da AlphaGo, ma in realtà c’è un filo conduttore tecnico di fondo che non è realmente cambiato.

Quindi la prima parte dell’algoritmo è addestrare una rete neurale a prevedere la mossa successiva. Il LLM di oggi inizia con il pre-addestramento di un’ampia raccolta di testi umani, ampiamente reperiti su Internet, per predire la parola successiva.

Per la seconda fase di AlphaGo, abbiamo preso informazioni dal corpus umano compresso in queste reti neurali e le abbiamo perfezionate, utilizzando l’apprendimento per rinforzo, per allineare il comportamento del sistema all’obiettivo di vincere la partita.

Quando impari a prevedere la prossima mossa di un esperto, sta cercando di vincere, ma questa non è l’unica cosa che spiega la mossa successiva. Forse non capiscono quale sia la mossa migliore, forse hanno commesso un errore, quindi devi allineare il sistema generale con il tuo vero obiettivo, che nel caso di AlphaGo era vincere.

Nei modelli linguistici di grandi dimensioni, lo stesso accade dopo la pre-formazione. Le reti non sono allineate con il modo in cui vogliamo utilizzarle, quindi eseguiamo una serie di passaggi di apprendimento di rinforzo che allineano la rete con i nostri obiettivi.

In un certo senso, non è cambiato molto.

Questo ci dice qualcosa su dove possiamo aspettarci che l’intelligenza artificiale abbia successo?

Ha conseguenze in termini di ciò su cui scegliamo di concentrarci. Se sei preoccupato di fare progressi su problemi importanti, i vincoli principali di cui dovresti preoccuparti sono se disponi di dati sufficienti per eseguire la formazione preliminare e se disponi di segnali di ricompensa per eseguire la formazione successiva. Se non hai questi ingredienti, non c’è alcuna intelligenza – sai, questo algoritmo contro quell’algoritmo – che ti farà decollare.

Hai provato simpatia per Lee Sedol?

Lee Sedol è stato l’emblema di questo traguardo irraggiungibile nell’estate del 2014. Poi all’improvviso trovarsi lì di persona, guardare la partita, la sua tensione, la sua ansia, la consapevolezza che questo era un avversario più degno di quanto pensasse, è stato molto stressante. Non vuoi mettere nessuno in quella posizione. Quando perse la partita, si scusò con l’umanità e disse: “È il mio fallimento, non il tuo”. È stato triste.

C’è anche l’abitudine in Go di rivedere la partita con il tuo avversario. Qualcuno vince o perde, ma alla fine rivedi la partita, apri il gioco ed esplori le variazioni tra loro. Lee Sedol non poteva farlo perché AlphaGo non era umano, quindi ha chiesto ai suoi amici di entrare e rivedere la partita, ma non è proprio la stessa cosa. C’era qualcosa di straziante in questo.

Ma non ho apprezzato tutta la narrativa uomo contro macchina che circondava la partita, perché AlphaGo è stato creato da un team di persone. Era il tentativo di una tribù di creare un artefatto che potesse consentire agli esseri umani di eccellere nel gioco. Alla fine questa è stata l’opera d’arte che ha richiesto tutto il nostro sangue, sudore e lacrime.

Pensi che ci sia ancora spazio per gli esseri umani nel mondo mentre l’intelligenza artificiale prende il sopravvento sul pensiero umano?

Stiamo imparando di più sul gioco del Go, e se pensiamo che il gioco sia bello, cosa che facciamo, e l’intelligenza artificiale può insegnarci di più su quella bellezza, c’è anche molta bontà intrinseca in questo. C’è differenza tra scopo e obiettivo. L’obiettivo del gioco Go è vincere, ma questo non è il suo unico scopo: uno scopo è divertirsi. I giochi da tavolo non vengono distrutti dalla presenza dell’intelligenza artificiale; Gli scacchi sono un’industria fiorente. Apprezziamo ancora l’intrigo e i risultati umani di quel gioco.

Soggetto:

Collegamento alla fonte