📊 Rock Paper Shotgun:揭秘 Metacritic 的魔法和炼金术
本文探讨了游戏评分聚合网站 Metacritic 评分机制的运作及影响,Metacritc 将多个来源的游戏评分转换并加权、生成了一个综合性的百分制“Metascores”,但该网站一直将具体的加权方法作为商业机密来封锁。
本文分析的重要理论依托是美国康奈尔大学教授 James Grimmelmann 2012 年发表的论文《Three Theories of Copyright in Ratings》,该论文主要讨论了美国是否可以对评分、评级进行版权保护,透过大量的文献及案例分析,Grimmelmann 找到了产品评分的三种可能定义:一是被定义为“事实”,可能使用一个可被其他人复现相同评价结果的测试方法,用以准确描述被评价事物,或至少准确描述评价者的感受;二是被定义为“意见”,因为评分代表某一个人或团体对某个事物的解释,而仍可存在对该事物的其他评判;三是被定义为“自我实现的预言”,因为评分可以决定人们对被评价事物作出怎样的反应,从而塑造现实、符合评分者的结论。
Grimmelmann 进一步评论到:如果评分是事实,那么它们是被发现的,评分者调查世界、了解有关被评论主体的事实;如果评分是观点,那么它们是被创造的,评分者对主体开展主观评价;而如果评分是自我实现的预言,那么它们是被强加的,评分者将提供一个引人瞩目的愿景、以至于它将被普遍接受。Grimmelmann 认为在实践中,人们往往在这三种对分数的理解之间漂移,当评分者在讨论分数是“客观”还是“主观”的时,他们彼此之间的对话就会变得模糊不清,这种漂移属性令人发狂、也使“评分”成为了一个永无止境的讨论话题。
作者认为,开发者们依赖评分和评级,不仅是为了模拟某种奖励,更是为了让玩家能够理解他们的世界,在“评分”这个领域,“分数”是塑造现实的手段、合并了 Grimmelmann 的第一、第三个定义,因为它就是“现实”──它既是你要操作的系统、也是你熟练操作后得到的小奖励,比如 RPG 游戏中用来鉴识道具的系统反过来也是我们对终极道具的幻想、体育游戏中运动员的雷达图即是对“六边形战士”的畅想。
但在这一基础上,Metacritic 的评分既保有重要性,却又具有不可忽视的缺陷。作者首先指出的是 Metacritic 不透明的“关键评价提纯”过程,这一过程很容易将评论的声音变得扭曲:其中一个重要的失败是该网站将其他所有数字评分体系都简单视为自身评分标准的衍生物,比如将“4/5 星”转换为“80/100 分”,但实践中这两种评分方式引发的情绪非常不同;另一个失败是只引用一篇评论的特定段落或句子,这导致了上下文缺失带来的误读、争论。
作者指出,Metacritic 试图“捕捉本质”的根本问题在于“将分歧视为一种不纯之物”,使得“评论共识”优先于“讨论”,以至于写一篇“偏离”总体评分的评论被视为“蓄意破坏”──一场值得“暴民正义”的破坏行为,而这会对游戏评论产生非常糟糕的影响。
与此同时,Metacritic“自我实现的预言”力量的阴暗面值得人警醒,比如微软曾在 2008 年宣布根据 Metascores 评分下架了一些“低端”Xbox Live Arcade 游戏,就像“在某个地层留下化石记录”一样。这让作者想起了美国历史上债券评级机构为了私利给债券打高分、最终慢慢走向 2008 年金融危机的过往。
作者表示,尽管 Metacritic 评分还没有到对游戏行业造成类似危机的地步,但我们乐见 Metacritic 能有一些改变,比如让加权算法更加公开透明,这必然损害网站的商业利益,但将让 Metascores 在分享观点、帮助发现游戏等方面发挥更多良性作用。
🔗 来源:Rock Paper Shotgun,作者 Edwin Evans-Thirlwell
📮 频道:@markonreview_express
🌐 访问 Markon Review 阅读更多
本文探讨了游戏评分聚合网站 Metacritic 评分机制的运作及影响,Metacritc 将多个来源的游戏评分转换并加权、生成了一个综合性的百分制“Metascores”,但该网站一直将具体的加权方法作为商业机密来封锁。
本文分析的重要理论依托是美国康奈尔大学教授 James Grimmelmann 2012 年发表的论文《Three Theories of Copyright in Ratings》,该论文主要讨论了美国是否可以对评分、评级进行版权保护,透过大量的文献及案例分析,Grimmelmann 找到了产品评分的三种可能定义:一是被定义为“事实”,可能使用一个可被其他人复现相同评价结果的测试方法,用以准确描述被评价事物,或至少准确描述评价者的感受;二是被定义为“意见”,因为评分代表某一个人或团体对某个事物的解释,而仍可存在对该事物的其他评判;三是被定义为“自我实现的预言”,因为评分可以决定人们对被评价事物作出怎样的反应,从而塑造现实、符合评分者的结论。
Grimmelmann 进一步评论到:如果评分是事实,那么它们是被发现的,评分者调查世界、了解有关被评论主体的事实;如果评分是观点,那么它们是被创造的,评分者对主体开展主观评价;而如果评分是自我实现的预言,那么它们是被强加的,评分者将提供一个引人瞩目的愿景、以至于它将被普遍接受。Grimmelmann 认为在实践中,人们往往在这三种对分数的理解之间漂移,当评分者在讨论分数是“客观”还是“主观”的时,他们彼此之间的对话就会变得模糊不清,这种漂移属性令人发狂、也使“评分”成为了一个永无止境的讨论话题。
作者认为,开发者们依赖评分和评级,不仅是为了模拟某种奖励,更是为了让玩家能够理解他们的世界,在“评分”这个领域,“分数”是塑造现实的手段、合并了 Grimmelmann 的第一、第三个定义,因为它就是“现实”──它既是你要操作的系统、也是你熟练操作后得到的小奖励,比如 RPG 游戏中用来鉴识道具的系统反过来也是我们对终极道具的幻想、体育游戏中运动员的雷达图即是对“六边形战士”的畅想。
但在这一基础上,Metacritic 的评分既保有重要性,却又具有不可忽视的缺陷。作者首先指出的是 Metacritic 不透明的“关键评价提纯”过程,这一过程很容易将评论的声音变得扭曲:其中一个重要的失败是该网站将其他所有数字评分体系都简单视为自身评分标准的衍生物,比如将“4/5 星”转换为“80/100 分”,但实践中这两种评分方式引发的情绪非常不同;另一个失败是只引用一篇评论的特定段落或句子,这导致了上下文缺失带来的误读、争论。
作者指出,Metacritic 试图“捕捉本质”的根本问题在于“将分歧视为一种不纯之物”,使得“评论共识”优先于“讨论”,以至于写一篇“偏离”总体评分的评论被视为“蓄意破坏”──一场值得“暴民正义”的破坏行为,而这会对游戏评论产生非常糟糕的影响。
与此同时,Metacritic“自我实现的预言”力量的阴暗面值得人警醒,比如微软曾在 2008 年宣布根据 Metascores 评分下架了一些“低端”Xbox Live Arcade 游戏,就像“在某个地层留下化石记录”一样。这让作者想起了美国历史上债券评级机构为了私利给债券打高分、最终慢慢走向 2008 年金融危机的过往。
作者表示,尽管 Metacritic 评分还没有到对游戏行业造成类似危机的地步,但我们乐见 Metacritic 能有一些改变,比如让加权算法更加公开透明,这必然损害网站的商业利益,但将让 Metascores 在分享观点、帮助发现游戏等方面发挥更多良性作用。
🔗 来源:Rock Paper Shotgun,作者 Edwin Evans-Thirlwell
📮 频道:@markonreview_express
🌐 访问 Markon Review 阅读更多