為何讓人工智慧玩《王者榮耀》,我們和研發團隊聊了聊
2023-04-01 22:13:58
中新網客戶端北京7月15日電(記者 宋宇晟)「整體的感覺就是AI太猛了,它們總是能做出異於常人的反應……」
在1:3輸給人工智慧後,有王者榮耀電競職業選手這樣說到自己對戰時的感受。
此後更有網友在社交媒體直言,「人類連玩遊戲也打不過AI了」「人類再次一敗塗地」……
那麼,讓人工智慧去玩《王者榮耀》就是為了「虐菜」嗎?中新網記者最近和該AI模型負責人聊了聊。
比賽現場。受訪者供圖
3:1 「屬於正常發揮」
幾天前,在世界人工智慧大會現場,一款名為「絕悟」的遊戲AI與五位來自王者榮耀職業聯賽的選手現場進行了一場表演賽。
有報導指出,人工智慧在比賽中相繼打出了「蹲草」「前後拉扯輸出」「輔助開團」等操作,並在團隊合作上頗具專業意識。
在這場五局三勝的賽事中,人工智慧以3:1的比分戰勝了五位職業選手。
儘管勝負成績成了關注這場比賽的網友討論的熱點話題王者榮耀的機器人是誰,但王者絕悟AI模型負責人邱福浩卻告訴記者,團隊對比賽的勝負沒有預期。
作為研發人員,他們更希望人工智慧可以把握與高水平玩家切磋的機會,驗證能力並不斷成長,雖然這樣的成績「屬於正常發揮」。
比賽現場。受訪者供圖
此外,很多網友猜測,相較於人類職業選手的反應速度,人工智慧或許在操作方面有著「絕對優勢」。
然而,邱福浩卻向記者明確表示,在數值和操作上,王者絕悟AI並沒有獨特的優勢,在遊戲中的客觀條件限制是一致的。
「在英雄的自身狀態參數上王者榮耀的機器人是誰,AI並沒有額外的加成,與人類玩家相同;AI在視野觀測上與人類玩家保持一致,對於戰爭迷霧中的不可見單位,AI同樣也看不到;AI的操作反應也做了客觀限制,其反應分布和均值與KPL職業選手是相接近的。根據實際觀察,人類玩露娜等英雄會比AI更秀。」
比賽現場。受訪者供圖
AI一天對局數≈人類440年
既然客觀條件沒有什麼不同,人工智慧為何能戰勝人類職業選手?
邱福浩給出的答案是訓練量。「AI的優勢在於其龐大的訓練量,一天對局數約等於人類440年。」
用研發團隊的話說,自2017年啟動項目,王者絕悟AI從模仿人類的監督學習,到自我博弈的強化學習,經過了多次迭代,攻克了多個難題,才逐步進化成了全英雄職業電競水平的「完全體」。
邱福浩介紹,2018年,王者絕悟AI還只是頂尖業餘玩家的水平;到了2019年,王者絕悟AI不再需要模仿人類數據,而是通過自己和自己對戰,進一步提升微操水平和大局觀,已達到了王者榮耀職業電競水平;去年,它學會了更多英雄玩法,並用40個英雄首次接受玩家們的挑戰;最新版本中,團隊又在競技比賽的局前和局內階段,進行了針對性優化。
資料圖:2016年的圍棋人機大戰。
幾年前,AlphaGO擊敗人類職業圍棋選手時,一度震驚世界。
與圍棋相比,《王者榮耀》是一個不完全信息博弈場景,需要多個AI協作完成任務,且需在複雜連續的決策空間下進行長期決策。
換句話說,教會人工智慧玩《王者榮耀》,比讓人工智慧下圍棋更難。
邱福浩說,圍棋的動作空間多達10的172次方,而AI在王者榮耀一局遊戲中的操作可能性則多達10的20000次方。
比賽現場。受訪者供圖
讓AI打遊戲不是終點
但,進行如此複雜的研發、訓練,就只是為了讓人工智慧在遊戲中打敗人類嗎?
邱福浩並不這麼看。因為人工智慧最終是要服務於人類的。
他告訴記者,團隊之所以就此進行研發,首先是因為「這是一個多人協作的遊戲場景,它在設計上的高複雜度、高挑戰性,滿足了對高水平AI+遊戲的研究需要」。
「從近年AI發展的關鍵事件可以看到,AI的下一個裡程碑很有可能就是在複雜策略遊戲中誕生。」
而人工智慧進行複雜遊戲訓練的,是為了幫助人類解決現實生活中的問題。
比賽現場。受訪者供圖
邱福浩說,AI在虛擬環境學習通用的感知、決策能力,未來可能在現實世界中發揮更大作用。以無人車研究為例,AI學習外界環境,感知道路環境信息並加以表達,進而作出駕駛決策;再如機器人在虛擬世界仿真學習,再在現實世界對環境的未知變化做出反應。
他認為,未來,AI研究還將覆蓋到更多場景。對於不少研究人員和開發者來說,多智能體技術研究依然存在顯著的現實困難,包括環境的不確定性、信息獲取的局限性、個體目標與全局目標的一致性,以及對高算力的要求。
在邱福浩看來,「AI+遊戲」研究將是團隊攻克AI終極研究難題——通用人工智慧(AGI)的關鍵一步。AGI代表研發能在通用系統中執行多種複雜命令,達到或超越人類水平的AI。
「這中間的經驗、方法與結論,長期來看,有望在大範圍內,如醫療、製造、無人駕駛、農業到智慧城市管理等領域帶來更深遠影響。」(完)
如需了解更多的收錢吧代理加盟詳情,請諮詢電話18883238888.全國招聘代理加盟商!!!