遊戲衆評到底在評價什麼?Metacritic和它帶來的問題(中)

本文由愛玩網獨家整理編譯,轉載請保留此行。

上一篇裡,我們談及了衆評網MetaCritic的評分極大地影響遊戲發行商開發者之間的關係,以及他們的生存狀況。今天,我們將會談談爲什麼不應該用一個量化的評分模式,來決定遊戲開發者的命運和生死。

爲什麼衆評分不應影響左右?

當第一次聽說《輻射:新維加斯》的獎金時,曾有一名Kotaku的遊戲編輯撰寫了一篇文章,批判發行商以MetaCritic的評分來衡量遊戲質量和對開發者的待遇。電子遊戲一直以來是一種非常個人體驗,老實說這是很難客觀地去評價東西,特別是那種武斷的打分對不同人來說可能有着不同的意味。比方說,你能解釋清81分和82分在質上的差別嗎?

發行商們這樣做顯然有其理由。但也有一些其他情況。其中之一就是,有人在玩弄這個系統。而且他們可能來自這三者(發行商、開發商玩家)之間不同的陣營。

遊戲評測是一種很主觀的觀點,將其模式化和量化地去評判,對遊戲業會產生巨大的影響

讓我們先來談談模擬評測的作者吧。他們的背景是這樣:一些發行商和開發者通常會僱傭顧問或遊戲評測家前往他們的辦公室,讓他們玩一款新遊戲的開發版,之後讓他們撰寫一篇模擬評測來預計遊戲在MetaCritic上會有怎樣的表現。通常來說,發行商和開發商會根據這些評測人士的意見來調整和改進遊戲。這類評測者從道德上來說是應該禁止從消費者角度去撰寫評測的,因爲他們是廠商花錢請來的。

一位化名艾德的某高端遊戲工作室的遊戲設計師,表示他曾經僱傭過這種評測作者,然後把報告丟進了碎紙機裡。艾德說他根本不在乎裡面寫了什麼。他只是想要保證的是,這個名聲狼藉的評分員,無法評測他的遊戲。艾德知道消滅至少任意一條帶來負面評分的內容,他都能讓遊戲在MetaCritic上獲得更高的分數

真正決定這個遊戲好玩與否的不是我們和我們的評分,而是作爲玩家的你的感受

包括愛玩網和Kotaku在內國內外很多遊戲媒體網站的編輯,都是明令禁止撰寫這類評測或爲我們報道的遊戲的發行商撰寫類似的稿件。

MetaCritic的經營者道爾表示他也聽過類似的事情發生。他說他的工作職責就是嚴格地審查在MetaCritic上近140篇的評測內容,他會仔細地檢查每個評測和評估其有效參考價值。他說:“我一致認爲避免人們玩弄評分系統很重要。”想法很美好,然而現實卻很殘酷。業內人士們也深知這一點。艾德說:“任何能優化我們評分的手段,我們都會去嘗試。”

不過有時候事情卻很微妙:許多評測活動中,會強迫遊戲評測者們從製作商的角度去評測遊戲;當分數更高時禁止多元化地評判遊戲;挑戰這個規則將會被派去辦公室談話並被驅逐。只要MetaCritic對製作遊戲的人能造成影響,那麼這些廠商永遠能找到干涉其的方法。

《超級猴子球》一款超歡樂的派對遊戲

而且對於遊戲發行商來說比較敏感的是,一些小網站和媒體爲了從Metacritic這種站點得到一些流量以便生存,他們可能去會做一些見不得人的交易。Adanced Media Network(現改名爲Kombo.com)的遊戲記者傑夫·里維拉說,在2006年時他就見過這樣的事情了。

他說:“當時我們和世嘉簽了一份協議,我們將在流量最高的DS頻道上推出爲期一週的《超級猴子球》專題。我負責評測,就在我準備發佈的前一晚,我的同事問我準備給遊戲打多少分。我和他說我還沒決定,並很奇怪爲何他會問這個,因爲以前從未發生過。同事告訴我說世嘉的PR人員說,如果我們評分在8.0以上,將可保證一天的獨佔報道。”

里維拉當時已經撰寫好了評測,然後他給出的分數是8.1.(目前這篇文章已經被刪除了,但你仍然可以在Kombo或GameRankings網站在評測文章列表裡看到)。里維拉說:“我和他們說我不知道要給多少分,因爲我不希望他們感覺我的評分被‘收買’了。告知他們評分我的壓力會更大,我就和他們說我不知道,但8.0和我想的差不多。”

這篇《超級猴子球》的評測雖然已被Kombo刪除,但MetaCritic上仍然留下了其最初的評分快照

後來有記者就此事詢問世嘉時,他們的發言人義正言辭地說:“世嘉有着非常嚴格的內部規定,禁止用任何手段獲得高分評測,或參與干涉評分的行爲。”不過里維拉說這事發生在2006年,現在無論世嘉是否加強過他們的規定,至少他們不會公然承認此事的存在(無論是真還是假)。

一些開發商和其他媒體的同行們則表示,這類事情在近些年來有所減少。但傳聞和流言依舊不斷。開發者會乞求評測方給予更高的分數。PR則在明知遊戲不怎麼樣時,內部將評測版發出去,或將遊戲的早期版本發給那些喜歡打高分的網站。

如果你在網絡上閱讀遊戲有關的新聞,你大概會知道一些MetaCritic關聯的網站:比如IGN和GameSpot,是付費越高聘請專門的寫手或評測人來撰寫遊戲評測。而MetaCritic名單上其他一些媒體,可能就不那麼知名了。一些無論是中國玩家還是美國玩家幾乎都從未聽聞過的媒體。

其實最大的爭議就在於:遊戲的好壞真能通過計算來量化評定嗎?

爲了體現大媒體的重要性,MetaCritic使用了一個權重系統來加強那些重要網站,讓他們的評分對整體分數影響更多。但是道爾和他的團隊卻不肯給出關於這個權重系統的細節。由於這部分的不透明性,使得MetaCritic在近幾年來受到了不少爭議:其中之一就是福賽爾大學的學術研究稱,他們計算出了MetaCritic的評分公式,然而最後發現他們的計算模式是錯誤的。這使得許多玩家發出了這樣的呼聲:爲什麼MetaCritic不乾脆公開他們的權重標準呢?

道爾這樣說:“在MetaCritic除了評測權重之外所有內容都是透明的。這看起來似乎影響很大,但實際上在我看來正好相反。如果你去掉這些權重,會發現對評分的數字影響不大。”道爾還補充了一些解釋:其中之一是他不希望發行商對那些高權重的網站施壓。另外一個原因是,MetaCritic經常調整這個權重標準,他們不想公開談及這些標準的原因,是不希望影響到那些權重較低的網站。

但是人們很難相信那些他們不懂的東西。因此也沒人相信衆評分是通過計算得來的。

道爾的另外一條規則在最近也是人們熱議的話題:在第一次評分之後,無論什麼原因MetaCritic都拒絕修改分數。道爾說這個規則已經執行了有一段時間。之所以這麼做,是因爲自從2001年網站上線以來,許多評測人會因爲各種原因更改他們的評分,道爾相信這是因爲他們受到了來自發行商的壓力。

“作爲一名收集大家評測的人,我決定屏蔽一切來自外界的干擾,無論是誰,用什麼政策,我們都要保護我們的評測員們,並支持他們第一首最誠實的觀點,我們會盡全力保證他們的觀點。”

MetaCritic的評分取值是單行線,無論什麼原因,只取第一次評分結果

不過有些時候,這種堅持似乎並不太妥當併爲MetaCritic帶來了一些輿論。2012年底,GameSpot將一位自由撰稿人撰寫的《自然法則2》評測撤稿,原因是這篇評測中有許多描述不正確的地方。另外一名寫手對這個遊戲的評測分數是8分。但是最初一份評測的影響卻一直流傳到了今天,這款遊戲在MetaCritic上評分仍然是60分。

再近一些的事情,Polygon網站會使用可調節的評測分數制度,在上一款《模擬城市發售之前給出了9.5/10的評分。遊戲發售之後,由於糟糕的服務器報錯問題使得遊戲幾乎無法進入,Polygon便將分數下降至8分。過了幾天之後,服務器登陸的問題依舊沒有解決,並引發了玩家的極大不滿,於是他們將分數下調至了4分。今天Polygon對這個遊戲的評分爲6.5,然而你登陸MetaCritic之後仍然會發現他們標記的Polygon打分仍然是9.5。

因爲服務器和內容問題而受非議的模擬城市在Polygon的評分

而道爾依舊堅持着他的原則:“MetaCritic的得分是遊戲剛發售時,或在發售後的快照。當他們發佈評測時,就是‘我已經玩了足夠久,我可以公平地評價這款遊戲了,我給出的分數是XXX。’”

除去發行商施壓和媒體之外,對於開發商還有一個問題:那就是玩家們的評分。當一款遊戲深得一批玩家喜愛的同時,卻受到另外一些玩家的不屑一顧時會怎樣?

Obsidian的厄克特說:“這就是問題所在。對好遊戲的預期是80至90分。如果一個好遊戲的分數是80至90,那麼一款普通的遊戲分數就是50左右。如果你想要85分,而有人給了你35分,那麼你的90分遊戲就被拉低到了85分……很簡單的數學計算,但是你要如何應對這種情況呢?你怎麼去阻止那些爲了自己出名而大噴特噴,並給分數做手腳的人?”

湯姆·奇克常年給遊戲打低分,但他表示這不是因爲遊戲不好,而是爲了豐富評測數據採樣

這樣的評測玩家並不是誇誇其談,一個名叫湯姆·奇克的玩家,經營着一個名叫Quarter To Thee的博客就是這樣的人。奇克在MetaCritic上給出了很多的最低評分,《生化奇兵:無盡》分數是60,而《光環4》只有20分。他使用1-5作爲評判標準,自己的評判乘以20就是換算成MetaCritic分值,所以當奇克說“我喜歡這個遊戲”並給出3/5時,那麼在MetaCritic的評分就是60分。而在MetaCritic上多數玩家看到這個分數之後都會認爲是一款爛遊戲。

不過奇克認爲自己的做法不是在搞亂,他說:“聚衆評價只有在作爲一個個體組成時纔能有好結果,而我認爲MetaCritic上很多數據都有問題,他們對數據簇的影響很值得懷疑。不過這並不是MetaCritic的問題,這是IGN、GameInformer和GameSpot的問題。只要識別了有效評價數據就能解決這個問題。這也是爲什麼我會給出低分,我認爲更廣的意見範圍可以增加其價值。”

無論是處於什麼願意,給出的分數就是潑出去的水,從而影響了開發者的士氣和創作力

奇克使用的是自己的評分標準,和MetaCritic上那些大網站評價很不同:舉個例子,GameInformer對一款60分遊戲的評價是“吸引力有限:雖然很多人喜歡這個遊戲,但是遊戲可以在體驗上做的更好。”奇克的60分則是完全不同的東西:“我認爲使用打分系統的所有範圍,使得3星意味着我喜歡這個遊戲。從字面上來說就是這樣。我在自己的博客上也有寫爲什麼3星的意思是‘我喜歡這個遊戲’,就這麼簡單。”

奇克的60分和GameInformer的60分平均下來分值也是一樣的。他們都影響着開發者的獎金。他們也都影響到了開發商和發行商之間的合同與商談。而且他們都改變了遊戲的製作方式。奇克說:“衆評系統的本質是從多個評分中收集結果,你可以指責說IGN給了一個遊戲92分而不是96分。我很同情這些工作室,因爲發行商們總是用一個誇張的數字來壓制他們。但這不是我的責任,我只對自己的讀者負責。”

奇克雖然打分很奇葩,但是他的評論還是值得玩家肯定的,他的評判非常尖銳和直白。然而他的分數也體現出發行商和開發商用MetaCritic時的最大問題:缺乏關聯性。當奇克的評分和GameInformer的評分差別巨大時,外界的人怎麼知道他們倆的分數意義相差如此之大?

玩家在評測和評分兩極分化十分明顯,而任何一款遊戲都是如此

還有一個值得思考的地方。如果一個遊戲被A深深喜愛,卻被B深深地憎恨,那麼這應該就被認爲是一款“中庸”的遊戲嗎?還是隻是一個一半愛一半恨的遊戲?如果兩個人給遊戲打了100分,2個人打了0分,那麼這個50分就一點意義都沒有,單純的只是兩極分化的觀點而已。

這個評分系統很有問題。我相信已經有不少人也這樣認爲了。

待續未完。下一章節將分享一下業內人士對此事的看法,以及我們對這種制度的看法。本文源自於Kotaku,原作者傑森·史雷爾