少兒編程 > 文章資訊 > 機器人 > 微軟開發(fā)人工智能系統(tǒng) 在吃豆人游戲中獲滿分
微軟開發(fā)人工智能系統(tǒng) 在吃豆人游戲中獲滿分
童程童美 2017-06-16
最近被微軟收購的一家深度學(xué)習(xí)初創(chuàng)公司Maluuba的研究人員開發(fā)了一套人工智能系統(tǒng),不管是人類還是電腦,該系統(tǒng)都已成為第一個在吃豆人游戲中獲得999990分完美成績的玩家。
摘要最近被微軟收購的一家深度學(xué)習(xí)初創(chuàng)公司Maluuba的研究人員開發(fā)了一套人工智能系統(tǒng),不管是人類還是電腦,該系統(tǒng)都已成為第一個在吃豆人游戲中獲得999990分完美成績的玩家。利用深度學(xué)習(xí)開發(fā)的程序擊敗電子游戲系統(tǒng)并不是什么新成就,但仍然值得注意,原因有以下幾點。
首先,它之所以引人注目,是因為它所選的游戲類型。上世紀80年代的街機游戲并不是為了被打敗而設(shè)計的,它們的設(shè)計初衷是為了讓人們能夠宅在家里玩。而當(dāng)吃豆人游戲Ms. Pac-Man版本發(fā)布的時候,它實際上比原來的吃豆人Pac-Man更難預(yù)測,所以玩家要想打敗它就更難了。
第二點,或許也是最值得關(guān)注的一點,是研究人員用來解決吃豆人游戲的方法。與其他研究人員所做的不同,這支團隊并沒有開發(fā)一個單獨的智能代理來學(xué)習(xí)整款游戲,而是使用了許多較為簡易的智能代理來學(xué)習(xí)這款游戲的某一個方面。例如,對于游戲中的鬼魂行為、水果行為、顆粒行為等,都由智能代理去學(xué)習(xí)。
有超過100個智能代理參與其中,每個單獨的代理都會根據(jù)自己關(guān)注的那個部分,來判斷吃豆人應(yīng)該會遵循的一套行動設(shè)定。然后,這些設(shè)定就會被匯總起來成為程序,這個程序會根據(jù)所有成果的加權(quán)平均偏好來決定吃豆人的行動。
“通過以這種方式分解問題,學(xué)習(xí)變得更容易了?!逼渲幸幻芯咳藛T在視頻中解釋道,“現(xiàn)在的情況是,很多智能代理學(xué)會了簡單的任務(wù),而不是只有一名代理學(xué)會了單項復(fù)雜的任務(wù)。”研究人員認為,把復(fù)雜的問題分解成更簡單、更小的問題,可以讓深度學(xué)習(xí)系統(tǒng)更容易處理復(fù)雜的行為。反過來,對于人工智能在未來可能會應(yīng)用到的現(xiàn)實任務(wù)來說,這種方法也是可取的。研究人員稱,即使一個問題只能被分解成兩、三個部分,也可能會令復(fù)雜問題“簡單化”。