AlphaGo挑戰《星際爭霸2》：必遭暴虐

2023-09-21 12:48:34 5

在 AlphaGo 戰勝了韓國圍棋棋手李世石後，DeepMind 創始人戴密斯·哈薩比斯（Demis Hassabis）就曾表示將研究以人工智慧與人類玩其他遊戲，例如即時戰略遊戲《星際爭霸》。不過目前看來，DeepMind AI要跟人類比賽打《星際爭霸》這事，還是有點兒懸。

早在2015年，DeepMind AI就開始用已經雅達利1977年發行的遊戲機Atari 2600來進行遊戲訓練，整個訓練過程團隊沒有提供任何額外信息幫助，全依靠AI自己來一步步學習如何打怪升級。在這些遊戲裡，有一款遊戲始終讓DeepMind AI很苦惱，那就是《Montezuma’s revenge》，這是雅達利一款難度超高的遊戲。

後來團隊找到了「好奇心」激勵機制，來讓DeepMind AI獲勝。他們給AI變成編程輸入「人工好奇心」，在AI探索更多的玩法的時候給予它更多的獎勵，鼓勵它去用不同的途徑來獲取更高的分數。在新版本裡，DeepMind AI在好奇心的驅動下探索了15個房間的遊戲。在沒有好奇心的時候，它只玩了2個房間。

今年3月底，在AlphaGo五局四勝贏了李世石之後，暴雪娛樂製作總監Tim Morten就在WCS中國區總決賽上確認，DeepMind AI將挑戰《星際爭霸2》，當時Tim Morten就直言DeepMind AI不會在《星際爭霸2》中戰勝人類。直接目前，這一場人機遊戲爭霸戰，官方都沒透露更多的細節。

實際上，《星際爭霸》作為一款即時戰略類的遊戲，給 DeepMind 的挑戰比圍棋更大。單單是對戰局面的數據獲取方面，兩者就相差巨大。圍棋棋盤上就只有數量不等的黑白兩色棋子作為數據，而遊戲中則包括了雙方兵力數量、兵種構成、能力屬性、時間等等等。另外作為即時戰略遊戲，《星際爭霸》需要在極短時間內執行策略，而圍棋相對來說則有充足的時間給AI運算思考。

目前，DeepMind AI想要打贏《星際爭霸》還是需要更長的時間學習和摸索。■