核心提示:值得注意的是,政府一般不理会网民对国家政策和政府领导人的严厉批评,反而却对重大事件发生时煽动抗议活动的帖子盯得很紧。审查最为严格的话题包括内蒙古抗议示威事件、持不同政见者艾未未被捕和福州征地事件引发爆炸案等。
发表:2012年7月3日
作者:PAUL MOZUR
本文由译者志愿者翻译并校对
Inline image 1
一旦收集到被审查的数据,接下来的挑战就是弄懂数据的意思。北京的一家网吧,2011年。】
密切关注中国公民正在社交网站上说些什么的不仅仅是中国政府。
随着5亿中国互联网用户迅速采用社交媒体,学者和企业家开始设法跟踪网上留言和博客帖子,以更好地了解政府审查的内容——甚至从中对政府的意图进行预测。
中国政府使用软件和数千大军监管互联网,但把大量审查工作都放在新浪公司这样的社交媒体网站上,以删除违反地方和国家有关规定的帖子,这些规定每周都在发布。尽管众所周知的一些字词或词组如天安门屠杀会受到审查,但审查的范围并没有被完全掌握。
这些网站通常会提供一些线索,说明是审查制度导致了某个帖子被删——删帖的不是用户,也并非技术问题导致帖子被删——同时留下特别留言或者诸如网络警察卡通人物之类的形象。这有助于研究人员弄清楚中国不透明的权力结构控制本国公民的方式。
香港大学中国传媒计划研究人员David Bandurski说:”我们现在对审查有一种半透明程度的了解,以前从没有过的。”
香港大学开发的WeiboScope软件能对新浪微博上的帖子进行扫描。香港大学助理教授傅景华说,设计这个软件是为了了解中国人对不同的新闻事件作何反应,但该软件对于分析审查趋势也很有用。傅景华参与了WeiboScope软件的开发。
WeiboScope软件的运行有些像搜索引擎,能对大约30万个用户帐户进行扫描。除了收集有关各个话题的帖子、允许研究人员搜索英文数据之外,WeiboScope软件还能对同一个帖子检查数遍,看看它是否已无法打开。如果无法确实无法打开,一则”错误信息”则提示这个帖子已被封,WeiboScope软件便将其加入被审查帖子清单。
香港大学中国传媒研究计划的研究人员经常在他们备受关注的博客上利用WeiboScope软件给审查者列为目标的话题作上标记并给予解释。
一个被删的帖子显示,在香港回归中国15周年纪念日到来之前3天,中国审查者就已经开始对提及计划在纪念日那天举行抗议活动的帖子下手了。
该帖还显示了需要人工梳理帖子的原因。该帖没有直接提及抗议活动,而是以即将到来的台风来比喻将在纪念日那天发生的事情。
一旦收集到数据,接下来的挑战就是弄懂数据的意思。哈佛大学教授加里·金最近发现,他开发的社交媒体分析技术可以应用于中国的审查模式。这种技术甚至还能事先预测重大新闻事件。
金先生在2007年与他人共同创建了克里姆森-赫克萨贡公司。该公司负责在社交媒体网站上为微软和星巴克等大公司测量消费者的情绪。该公司的软件并非仅仅对关键词进行扫描,而是利用一种算法对用户确定的一套分类和主题进行数据分析。
去年,金先生利用克里姆森公司的社交媒体数据库开始对大量有关中国的社交媒体数据进行分析。这些数据涵盖的帖子超过了1100万个,涉及1382个中国论坛。
金先生选择了政治敏感性不同的85个话题——从内蒙古的抗议活动到一款颇受欢迎的视频游戏——并根据内容(涉及新闻、政府政策、色情、审查制度还是”群体性事件”等)对帖子进行分类。金先生然后利用克里姆森公司的软件进行检查,看一看每个种类中有多少帖子后来遭到了审查。 
在新发表的一份报告中,金先生和其他研究人员发现,社交媒体上有13%的帖子遭到审查。
值得注意的是,政府一般不理会网民对国家政策和政府领导人的严厉批评,反而却对重大事件发生时煽动抗议活动的帖子盯得很紧。审查最为严格的话题包括内蒙古和增城的抗议示威事件、持不同政见者艾未未被捕和福州征地事件引发的爆炸案等。
所以,一般情况下审查者可能会对网民就南海问题发表的民族主义言论置之不理,但在去年中国与越南发生争执时,他们可能就要删除有关这个话题的帖子了,因为他们担心人们举行抗议活动。
色情内容和有关审查制度的言论也几乎无一例外地遭到审查。
很多审查行动都发生在原始帖出现后24小时内。金先生写道:”这是一个惊人的组织成绩,需要有大规模军事行动那样的精确度。”政府必须决定审查什么,将决定传达给数以万计的个人,后者在24小时内实施审查。
但找出帖子为什么消失是成功了一半。金先生说公司正在观察该软件是否能够预测中国的政策动向。
作为分析的一部分,金先生发现,审查率在中国和越南发生纠纷期间猛升,但有关这个问题的遭审查帖子在两国2011年6月出人意料地达成和平协议的前5天又急剧减少。还有一个例子。讨论中国艺术家、政治活动家艾未未的帖子在他被捕的前几天开始减少。
金先生说:”成千上万的人们卷入进来,帮助政府保守秘密……而一个有意思的悖论是,如此巨大的一个项目本来是用来防止人们了解那些事,事实上却暴露了自己。大象留下了自己的大脚印。”
通过订阅和咨询服务,克里姆森-赫克萨贡公司一直在使用该软件帮助企业们了解品牌认可的细微差别,金先生在5月份为该软件申请了专利。
但公司表示,他们对中国市场寄予厚望。由于软件是依据个人在社交媒体所发帖子的分类,它很容易跳过语言和文化障碍,这意味着它可以帮助更多的公司了解难以捉摸的中国客户是如何认知他们的,或者至少是如何在网上谈论他们的。
金先生说这只是个开始,他希望基于地理分划分解审查数据,考察地方和全国审查政策的差异,并进一步观察删除帖子是否能预示政策的变化。
他不是一个人在战斗。其他人,比如卡内基-梅隆大学计算机学院的研究人员们,最近开展了一项对新浪微博的大规模研究,试图发现在所有那些正在从中国网络上消失的互联网碎语之下埋藏的模式。
作者邮箱:[email protected]
本文版权属于原出版公司及作者所有。©译者遵守知识共享署名-非商业性使用-相同方式共享 3.0许可协议。

译文遵循CC3.0版权标准。转载务必标明链接和“转自译者”。不得用于商业目的。点击这里查看和订阅《每日译者》手机报。穿墙查看译者博客、书刊、音频和视频

本文由自动聚合程序取自网络,内容和观点不代表数字时代立场

定期获得翻墙信息?请电邮订阅数字时代