• 文字大小:
  • A A A

参差计划 | 2013年07月25日 星期四 11:04 AM

揭秘维基百科十大最富争议词条

译者 / 宋恩杰

一篇分析维基百科的极具争议性的文章显示,在跨文化、跨语言的环境中某些争议性话题也是带有共通性的。

任何人都有权限编辑词条内容的维基百科是众人非凡的集体智慧的结晶。根据维基百科自己的估计:有超过77,000人用285种语言贡献了超过22,000,000篇文章。英文版是其中最大的编辑文本,贡献了超过4,000,000篇内容。

因此,在编辑过程当中对这些词条内容出现分歧是毫无疑问的。实际上,分歧往往引发一场措辞方面的“大战”。通常赋予争议性的词条措辞被修改之后,马上就会有人迅速地又将其修改回来。

通常这些所谓的“词条大战”可以确定某些富有争议性的话题,而且还能看到跨文化、跨语言区之间的人们对这一话题是如何进行极具趣味性的争论。考虑到维基百科在跨文化、跨语言交流方面的独特位置,它或许能够给我们提供一些有趣的答案。

现在,牛津大学的Taha Yasseri和他的朋友们根据“词条大战”中争议的强度和广度列出了在10种不同语言中最具争议性的话题。

这个结果能够让我们以一种奇妙的方式一窥在不同语言环境中的人们之间是如何发生冲突以及如何处理这些问题。Yaseri及其团队还向我们揭示了常见的语言区内是如何解决世界上某些争议性的冲突的。

他们首先要做的是如何定义一个政论性话题。在维基百科当中,某一词条的编辑历史迅速变化并不能很好的衡量一个话题的冲突性;也许这只表明了这个词条是个快速变化的话题。

于是,Yasseri和团队成员更加关注词条内容的“恢复”--也就是完全撤销最新编辑时发生的的措辞变化而还原到更早的编辑版本。在维基百科当中恢复到更早的版本非常常见,也不能作为考察争议性词条的唯一标准。

因此Yasseri和成员们更关注那些“相互恢复”的词条--如果某个编辑版本被人恢复,另外的一些人会改变这次“恢复”编辑。如此反复。

这样我们就可以对“富于争议性”下一个简单的定义了:Yasseri和他的伙伴们认为:某个词条的争议性可以被确定为是由其除最初编辑者之外的“相互恢复”版本对的求和,然后乘以词条的总编辑数。

然后他们通过搜索在维基百科中不同语言版本当中“相互恢复”数计算出词条的争议性强度。

最后他们给出在每种语言中最具有争议性的话题列表。下面是英语当中10大争议性词条:

1、小布什
2、无政府主义
3、穆罕穆德
4、WWE雇员名单
5、全球变暖
6、割礼
7、美国
8、耶稣
9、种族与智力
10、宗教

1         George W Bush
2         Anarchism
3         Muhammad
4         List of World Wrestling Entertainment, Inc. employees
5         Global Warming
6         Circumcision
7         United States
8         Jesus
9         Race and intelligence
10     Christianity

同时,Yasseri和同事们将争议性话题分为了三个语言组别:1、英语、德语、法语、西班牙语;2、捷克语、匈牙利语、罗马尼亚语;3、阿拉伯语、波斯语、希伯来语。以辨别哪些争议性话题在各个组别是互相重叠的。

大体上在涉及到宗教和宗教人物的词条以及反犹主义和以色列的词条在很多语言当中都极富争议。从他们的报告我们可以看出:特别是涉及到以色列、阿道夫·希特勒、大屠杀以及神的话题上,三个语言组别都呈现出很高的争议性。

但是,某些议题较小的话题在多个语言中似乎也颇具争议性,大部分争议性话题则与语言的不同有关。因此可能在某种语言中极具争议性的话题在其他语言中就不一定了。例如:马尔维纳斯(the  islands  Malvinas)/福克斯群岛(Falkland islands)在西班牙语版本的维基百科中就极富争议性。(但在其他语言中则没有)。

观察某个话题在不同语言中为某个他们认为值得的理由争论是一件非常有趣的事情。

Yasseri和他的团队对未来也充满期待。他们说在他们对争议性话题的衡量过程中随时间的推移话题本身极其编辑工作也发生了很大的改变。因此,他们未来计划研究争议性话题在动态方面是如何随着时间的推移而改变的。这一定会很有趣的不是吗?让我们拭目以待吧。

 

本文转自参差计划

此文章为转载,不代表IBTimes中文网的立场和观点。


无觅关联推荐,快速提升流量 标牌制作