少兒編程 > 文章資訊 > 機器人 > 微軟開發(fā)人工智能系統(tǒng) 在吃豆人游戲中獲滿分

微軟開發(fā)人工智能系統(tǒng) 在吃豆人游戲中獲滿分

童程童美　2017-06-16

最近被微軟收購的一家深度學(xué)習(xí)初創(chuàng)公司Maluuba的研究人員開發(fā)了一套人工智能系統(tǒng)，不管是人類還是電腦，該系統(tǒng)都已成為第一個在吃豆人游戲中獲得999990分完美成績的玩家。

摘要

最近被微軟收購的一家深度學(xué)習(xí)初創(chuàng)公司Maluuba的研究人員開發(fā)了一套人工智能系統(tǒng)，不管是人類還是電腦，該系統(tǒng)都已成為第一個在吃豆人游戲中獲得999990分完美成績的玩家。利用深度學(xué)習(xí)開發(fā)的程序擊敗電子游戲系統(tǒng)并不是什么新成就，但仍然值得注意，原因有以下幾點。

首先，它之所以引人注目，是因為它所選的游戲類型。上世紀80年代的街機游戲并不是為了被打敗而設(shè)計的，它們的設(shè)計初衷是為了讓人們能夠宅在家里玩。而當(dāng)吃豆人游戲Ms. Pac-Man版本發(fā)布的時候，它實際上比原來的吃豆人Pac-Man更難預(yù)測，所以玩家要想打敗它就更難了。

第二點，或許也是最值得關(guān)注的一點，是研究人員用來解決吃豆人游戲的方法。與其他研究人員所做的不同，這支團隊并沒有開發(fā)一個單獨的智能代理來學(xué)習(xí)整款游戲，而是使用了許多較為簡易的智能代理來學(xué)習(xí)這款游戲的某一個方面。例如，對于游戲中的鬼魂行為、水果行為、顆粒行為等，都由智能代理去學(xué)習(xí)。

有超過100個智能代理參與其中，每個單獨的代理都會根據(jù)自己關(guān)注的那個部分，來判斷吃豆人應(yīng)該會遵循的一套行動設(shè)定。然后，這些設(shè)定就會被匯總起來成為程序，這個程序會根據(jù)所有成果的加權(quán)平均偏好來決定吃豆人的行動。

“通過以這種方式分解問題，學(xué)習(xí)變得更容易了?！逼渲幸幻芯咳藛T在視頻中解釋道，“現(xiàn)在的情況是，很多智能代理學(xué)會了簡單的任務(wù)，而不是只有一名代理學(xué)會了單項復(fù)雜的任務(wù)。”研究人員認為，把復(fù)雜的問題分解成更簡單、更小的問題，可以讓深度學(xué)習(xí)系統(tǒng)更容易處理復(fù)雜的行為。反過來，對于人工智能在未來可能會應(yīng)用到的現(xiàn)實任務(wù)來說，這種方法也是可取的。研究人員稱，即使一個問題只能被分解成兩、三個部分，也可能會令復(fù)雜問題“簡單化”。

上一篇：美國加速對無人駕駛實行立法監(jiān)管還設(shè)立了三個目標下一篇：人工智能咨詢公司Element AI獲微軟等1.02億美元A輪融資

日日日干干干_国产91精品久久久久久久网曝门_97色资源_久久久一_av免费观看网站_午夜免费影院_亚洲一区二区三区国产

微軟開發(fā)人工智能系統(tǒng) 在吃豆人游戲中獲滿分