放棄吧!openAI玩DOTA2的表現比我們"更像人類"

本站愛玩百萬稿費活動投稿,作者 尹紫電,未經授權請勿轉載

兩年前Alpha Go以4:1大敗李世石一戰,除了炒熱了“人工智能”這個概念之外,順便也讓打《星際爭霸》和《星際爭霸2》的AI們蹭了一次熱度。《星際爭霸2》微操AI“悍馬2000”機槍無傷甩毒爆、小狗踏破坦克陣、運輸機無限坐電梯視頻又被翻了出來,在玩家間被大量轉發。而歷史悠久卻鮮爲人知的《星際爭霸1》AI大賽也開始爲玩家們所知曉。

不過彼時玩家的心態反而比較淡定,雖然AI玩家能做出人類玩家一輩子也沒法完成的操作,但沒有人認爲AI能在《星際》上戰勝人類。前《星際1》選手“總司令”宋炳具在韓國舉辦的“人類 vs AI”大賽中摧枯拉朽般4:0零封了AI,過程簡單的就像吃飯喝水,每次都是一拳打死AI。坊間的主流觀點是圍棋的規則簡單而明確,變量較少,沒有未知因素。但電子遊戲中的各種參數和變量遠超圍棋,光是戰爭迷霧的設定就夠AI頭疼的了。所以雖然AI能在圍棋上戰勝人類,但在遊戲這個項目上,AI想要有所突破目前來看幾乎不可能。

AI操作散槍兵

“悍馬2000”雖然能做出各種驚豔操作,但那是讀取了內存數據的結果,本質上等同於作弊。而已經有十幾年歷史的《星際爭霸1》的AI選手們在人類玩家面前表現得依舊像個弱智,也許能唬住初次面對AI的人類玩家,但很快就會“黔驢技窮”,被人類玩家找到漏洞吊打。2012年那屆《星際爭霸1》AI大賽上“AI VS 人類”的環節,AI玩家就因爲迅速被人類玩家發現“如果附近有敵人AI的農民就不會採礦”這個漏洞後被玩壞。

於是乎,“人類尊嚴的最後一塊遮羞布”這個接力棒順理成章的從圍棋交到了電子競技手中,不願接受現實的人們也可以安慰自己“還沒輸,AI打遊戲還打不過我們”。不久後又傳來消息,開發Alpha GO的公司Deep Mind轉攻《星際爭霸2》項目受挫,決定放棄項目出坑。這意味着連都Deep Mind認爲目前讓AI打《星際爭霸2》是不可能的,看來說AI戰勝人類還言之過早,真是令人歡欣鼓舞。

電子競技代替圍棋在當時成爲了“人類尊嚴之盾”,玩家們很是受寵若驚可是…

然後,就是OpenAI的SOLO專精AI在TI7上碾壓Dendi的表演——在這個振奮人心的當口給我們澆了一杯冷水。要知道,讓AI打《DOTA》可比打《星際2》難得多得多。《星際爭霸2》的遊戲形態和圍棋還比較接近,更多是宏觀決策。而《DOTA》則完全是另一碼事了,金錢兵線補刀、仇恨、技能等每一個機制都夠開發者頭疼的,複雜程度相比於《星際爭霸2》擴大了不止一個數量級

就拿金錢來說,現有的MOBA遊戲中自帶的對戰AI都是定期“領工資”,永遠遵循着一套出裝順序,而一個正常的人類玩家則會選擇針對性的出裝。在兩年前的這個時候,在Deep Mind在《星際爭霸2》項目上棄療的時候,電子競技對於AI而言還是一堵不可逾越的城牆。但OpenAI所開發的SOLO AI卻橫空出世,在這堵牆上鑿了一個縫。

《星際爭霸2》等遊戲中自帶對戰電腦,與其說是AI,不如說是智障

它不僅在TI7現場戰勝了Dendi,根據過後放出的視頻,它還戰勝了一衆現役選手。但這仍然是一場有着諸多限制條件勝利,對戰限定在中路,沒有神符和瓶子,英雄限定爲影魔,種種限定條件無疑是將遊戲中的變量儘可能的減少。所以覺得輸給AI很不服氣的玩家們都會這樣安慰自己“只不過是中路SOLO罷了,不服打一場標準的5V5。”但不可否認,電子競技這堵擋在AI面前的堅牆的確是被OpenAI鑿出了一道縫隙,電子競技這塊“遮羞布”可能也要不夠用了。

TI7上的亮相後,OpenAI宣佈下一步是開發能夠真正進行進行一局標準的5V5《DOTA2》對抗的AI,並表示希望在TI8上讓AI和人類玩家對抗。不客氣地說,當時的筆者認爲這存粹是爲了吸引投資者而吹的牛X、畫的大餅。因爲SOLO和5V5的複雜程度完全是兩個概念,才鼓搗出一個SOLO機器人而已,轉頭就號稱要在一年內開發出能5V5的AI?開什麼玩笑?

TI7上烏克蘭司機千里迢迢被叫到西雅圖,然後被一頓暴打

結果你們都知道了,筆者被無情打臉。OpenAI的AI們在5V5的《DOTA2》比賽中戰勝了現場普通觀衆,同時也戰勝了由退役選手和解說組成的玩家水平前0.05%的隊伍,人類玩家甚至堅持不過半個小時。雖然依然是帶着限定條件的勝利:英雄池限定在18個英雄中,五隻無敵信使等等。人類玩家最後靠給AI選天然劣勢的脆皮陣容纔沒有被零封。

狼,這次真的來了。去年OpenAI的程序員號稱要開發出能夠進行一場標準《DOTA2》比賽的AI時,所有人都覺得他們在吹牛皮,但是在一年後的今天,雖然這個牛皮還沒有完全實現,但是至少也已經實現了40%。雖然有着種種限制條件,但是不可否認的是AI的確是像人類一樣在打《DOTA2》,而這很關鍵。

圖靈測試核心在於機器是否能像人類一樣做出反饋

“人工智能之父”艾倫?圖靈提出過一個實驗思路用來鑑別機器是否擁有人類智能,這就是大名鼎鼎的圖靈測試。圖靈測試的核心思路就是讓人類在不知情的情況下向機器提問,如果人類無法分辨回答問題的是機器還是人類,那機器就通過了圖靈測試,可以被視爲擁有人類智能。

我們也可以將AI和人類玩家的《DOTA》比賽視爲另一種類型“圖靈測試”,如果AI玩家和人類玩家在ID、飾品等內容上無法區分,也不允許雙方打字或對話。觀衆們僅能通過玩家們在賽場上的表現區分誰是AI誰是人類,那麼OpenAI Five的表現已經可以欺騙相當一部分的玩家了。

AI在遊戲中打的極具進攻性

和《DOTA2》自帶對戰電腦打過的玩家,都知道那些電腦有多蠢,電腦在線上也不懂得維持自己的血量,玩家可以輕易在線上將電腦殺崩。而且電腦的思維模式也被玩家摸得一清二楚,無非就是五人抱團中推,一個人帶線就可以牽制所有電腦,再抓住落單的挨個擊殺。

而OpenAI Five的表現則完全不同,如果無視AI們的英雄頭上頂着的“OPEN XX”的ID,他們的表現似乎更像人類,而人類玩家倒更像是被抓住思維漏洞的一方。比如第一局比賽,AI用一個輔助巫妖下路與人類玩家三核之一的死靈法師放單,通過巫妖的吃兵壓制死靈法師的經驗並把死靈法師拖在下路。而在上路通過剛三把人類的1號位大哥打崩。AI的這個思路不禁讓人想起田忌賽馬:用自己的下等馬和敵人的上等馬兌子,換取另外兩路的優勢

OpenAI團隊,中間捧着的筆記本代表着Open DOTA的原型

除此之外,OpenAI Five還有許多或亮眼、或上頭、或犯蠢的舉動讓它們看起來更像是真正的人類玩家,例如塔下強殺後抓住對方沒有打斷淡定TP回家、四人抱團強衝下塔殺人、在敵人臉上開霧秒被破等等。相比之下,人類玩家們隊友被衝塔卻不TP支援、毫無戰術思路可言猶如一盤散沙、被AI各種偷塔牽制五人的表現反而更像那些平日裡被玩家暴捶的《DOTA2》自帶對戰電腦,也難怪會有玩家發出質疑“那些真人玩家不是在演戲放水吧?”

沒有,人類玩家們沒有演戲。這只是五個從未合練過的玩家野隊面對一支團隊時的正常表現,本質上等於五個路人碰到了五個黑店。而AI們對自己的戰術貫徹的又足夠堅決,於是就有了這幾場碾壓般的比賽。事實上普通玩家們在路人局中肯定也有過類似的體驗,如果前期打的很順,中期又有人願意出面指揮,五人齊心協力三路速推,普通玩家也能體驗到這種快到不可思議的勝利。

AI表示:菜雞,擡走,下一個

圖靈認爲,在2000年時人類可以設計出能夠在5分鐘問答內欺騙30%成年人的人工智能。如果我們將AI對陣人類的《DOTA2》比賽也視爲一種變相的圖靈測試的話,那麼OpenAI Five恐怕也能欺騙相當一部分的人類觀衆。雖然OpenAI Five距離完全通過“圖靈測試”還有相當一段距離,但它的確已經具有了相當程度上的智能。

而當下的我們正處於一個有趣的歷史節點中。一方面,號稱AI已經攻陷了《DOTA2》還爲之過早,因爲OpenAI Five顯然還不夠成熟,英雄池仍然限定在18個英雄中,AI們仍需要在額外限定若干條件才能進行遊戲。所以“人類一敗塗地”的說法無疑是個誇大的笑話,OpenAI Five想戰勝頂級《DOTA2》強隊還尚需時日

AI目前還只會玩18個英雄,類似於DOTA2新手模式

但另一方面,事情有意思就有意思在這“尚需時日”四個字。雖然AI還不夠強,但是《DOTA2》項目的淪陷已經進入指日可待的狀態。根據OPENAI工作人員的Q&A以及公佈的內容,他們現在正在做的本質上不是訓練AI打《DOTA2》,而是告訴AI,怎樣纔算贏。只要AI明白在《DOTA2》什麼才叫贏,剩下的就是讓AI自己摸索。所以這次OpenAI Five VS 人類的對抗的重點不是輸贏,而是證明了OPENAI找對了路子,他們只要沿着這條路走下去就必然能超越人類玩家。

我們其實已經見識過AI一日千里的進步速度了。去年的TI7上,Sumail頭一天晚上還能和AI中路單挑時還能打的有來有回,但是他晚上睡覺時,AI根據白天的SOLO比賽優化了算法,於是第二天他與AI再次交手時慘遭痛毆,一個小分都沒能贏下。

蘇美爾被OPENAI吊打後…

而循着OpenAI Five的足跡,我們可以發現AI不僅在不斷進步,而且進步的速度越來越快。最早公佈的AI只能在全部玩家都是用相同英雄“矮人火槍手”的情況下進行遊戲。而且還有這諸多限制條件:沒有隱身、沒有神符、不能插眼等等。隨後,限制條件逐漸放寬,英雄池也逐漸拓展。

而就在OpenAI Five VS 人類高玩的比賽的不久之前,它們還有過一次亮相,也是與人類對戰並最終取勝。那時,AI們還只能在限制5個英雄,不能使用隱身道具、不能插眼、不能開霧、沒有神符等限制條件下比賽,而不久後的今天,這些限制條件都沒有了,英雄池也拓展到了18個。按照目前的進步速度,只要再給它們時間,我們必定能看到不需要附加任何限制,使用全英雄池的AI玩家們。而我們恰好就尚處於這個《DOTA2》尚未淪陷但即將淪陷的過渡期。

烏克蘭老司機屬於被殺了祭旗宰牲

說實話,Alpha Go擊敗李世石時對於不下圍棋的DotAer而言並沒有什麼觸動,那畢竟是一件離自己很遙遠的事情。但這次不一樣,狼到了家門口了。所以當OpenAI Five殺敗一衆人類玩家時,至少筆者有那麼一點身爲人類自尊心受傷的感覺。也正是基於這種“不想承認人類輸了”的樸素情感,許多玩家開始強調一個詞——公平

AI把英雄池限定成18個,這不公平;

AI比賽要用五個無敵信使,這不公平;

AI的反應速度太快了,這不公平;

AI五個人團隊意識強的如同一個人,玩家則從來沒合練過,這不公平;

AI一天能練習180萬次,人類玩家睡覺AI還能聯繫,這不公平;

AI直接使用接口進行數據交互,人類需要使用鍵鼠外設,這不公平……

AI一天的練習量,是人類一輩子都達不到的

總而言之就是:這是一場不公平的對抗,AI有着種種種種的優勢,所以我們不服,人類還沒輸。

AI和人類的對抗是否公平?爲了回答這個問題,我們可以逆向思維一下,那要怎麼樣纔算公平呢?給AI設計一套機械臂讓AI也使用鍵鼠操作?那機械臂是否要設計成人手的形狀和結構?如果AI有四個機械臂是否公平?給AI安裝攝像頭讓AI通過觀看顯示器獲取數據?那要裝一個攝像頭還是兩個攝像頭?人眼有兩億像素,給AI裝多少像素的攝像頭纔夠公平?甚至再吹毛求疵一些,人類通過呼吸作用獲取能量,而AI通電就可以,是否要給AI的主機裝一個生物胃纔夠公平呢?

追求這種“公平”其實已經走入了一種思維誤區,根本原因是我們不願意接受《DOTA2》項目淪陷而選擇逃避現實。追求人類和AI絕對公平是不可能的,而且與開發設計AI的最初目的南轅北轍。我們反過來說,讓AI與人類玩家在相同條件下比賽(使用機械臂等等),對AI玩家是否公平呢?畢竟通過光電信號交互信息是AI的天然屬性。

糾結公平不公平本質上只是因爲我們不服輸

更重要的是,像OpenAI Five這類項目的真正目的不是爲了證明人類不如AI,而是爲了證明AI也能像人類一樣根據接收的信息做出合理的決策。AI在某些方面的確是優於人類這是毋庸置疑的,根源上來說AI在內部使用光電信號以光速傳遞信息,而人類在內部使用化學信號+電信號傳遞信息的模式比AI低了N個數量級,所以AI能夠以遠超人類的速度進行計算和內部信息傳遞,這是AI的天然優勢。

OpenAI強化學習的遊戲庫中有上千款經典遊戲,進行“跨遊戲泛化”研究。檢驗AI一款遊戲玩輸了之後,能否把這個經驗運用到其他遊戲中去?

我們需要了解一點,開發AI的目的不是爲了和人類對抗,而是爲了和人類協作。只不過像圍棋、《星際爭霸2》、《DOTA2》這些項目對抗性太過激烈。所以讓我們產生了不服輸的心理。而實際上AI真正大展身手的地方不是臺前而是幕後,現有的遊戲廠商中,與AI技術結合的最好的不是別人,正是育碧。而育碧把AI技術用在了哪裡呢?他們沒有開發一款超強AI血虐玩家,而是用AI來——找BUG,順便改進了他們的動作捕捉系統讓遊戲中的人物動作更流暢更真實。作爲人類的助手,而不是人類的敵人,這纔是AI在未來真正的定位。

開發AI的目的不是對抗人類而是協助人類

至於當下,我們能做的只能是放下“人類不能輸給AI”的自尊,不再去找各種不公平的藉口,躺平接受《DOTA2》項目將要淪陷的事實,期待OpenAI Five在TI8上的表演。

AI的進步對人類而言是好事,唯一受傷的,只有我們的自尊心。

招募野生寫手!尋找遊戲達人!快來參加愛玩百萬稿費活動吧

遊戲專欄投稿信箱:otaku@vip.163.com

歡迎關注愛玩APP【精選】板塊,更多精彩等着你!