為了實(shí)現(xiàn)MuZero AI的目標(biāo),早在今年4月DeepMind就創(chuàng)建了一個(gè)名為Agent57的實(shí)驗(yàn)性AI,它的任務(wù)是游玩40年前57個(gè)雅達(dá)利游戲。 DeepMind團(tuán)隊(duì)解釋說(shuō)之所以選擇雅達(dá)利游戲是因?yàn)椤斑@些游戲?yàn)锳I提供了豐富的任務(wù),AI必須制定復(fù)雜的行為策略來(lái)掌握這些任務(wù),同時(shí)游戲本身還提供了一種輕松的進(jìn)度指標(biāo)(也就是游戲內(nèi)的得分)這可以讓AI自行判斷并優(yōu)化自己的策略,優(yōu)中選優(yōu)最后完美完成任務(wù)?!毖巯翸uZero的出現(xiàn)意味著人工智能不再需要機(jī)械的學(xué)習(xí)人類的單一規(guī)則,只需要一套通用算法,MuZero就可以自行掌握諸如圍棋、日本將棋、國(guó)際象棋以及雅達(dá)利游戲,未來(lái)人工智能還能發(fā)展成什么樣子,我們只能繼續(xù)期待。