Circa un anno fa, Demis Hassabis (co-fondatore di DeepMind) presentò a “First Day of Tomorrow”, una conferenza su tecnologie “disruptive”, un programma capace di imparare da solo a giocare a Breakout (un videogioco di Atari del 1976) e altri videogiochi:

Dopo un’ora di gioco, il programma è più o meno abile quanto me, il che significa che non è granché — ma sta scoprendo i rudimenti del gioco. Dopo altri 30 minuti, e 200 round, l’A.I. è diventato talentuoso: perde la palla solamente ogni tre o quattro round. Il pubblico ride; simpatico, no?

Poi succede qualcosa. Al 300esimo gioco, l’A.I. inizia a smettere di perdere la palla. Il pubblico inizia a mormorare.

Quello che succede poi? Il programma inizia a fare uso di una mossa che nessuno — nemmeno i creatori del videogame — aveva mai immaginato. Ore dopo aver incontrato il suo primo videogame il programma ha imparato a giocarci meglio di qualsiasi membro del pubblico, senza il minimo aiuto di un umano, senza alcuna istruzione su come vincere o muoversi nel gioco.

(Qui c’è il paper pubblicato su Nature)