加州伯克利大学网站自去年4月起开始收录被新浪微博禁止搜索的敏感词。从去年4月16日到今年8月15日,这个网站共收录了1543个敏感词,即平均每天都有3.2个新的敏感词问世,这说明审查机构和网民间“猫捉老鼠”游戏不断升级。
她是高贵的官太太,他是卑微的勤务员。他从来没有想过,会在这样一种情形下如此接近她……在西部城市的一栋幽静别墅里,他从门后走出来,将一个小玻璃瓶递给她,再看着她将瓶中的液体缓缓倒入醉倒在床上的另一个他口中……
对不起,这段小说式的描绘是个误会,有关“她和他”的故事,上周在中国微博中呈现出来的其实是这样:“她和他故意杀人案一审宣判,认定她犯故意杀人罪,判处死刑,缓期二年执行,剥夺政治权利终身;他犯故意杀人罪,判处有期徒刑九年。”
没有琼瑶式的情节,只有一纸司法判决。在中共前重庆市委书记薄熙来之妻谷开来(薄谷开来)杀人案宣判后,《财经》杂志的官方微博用了隐晦的“她和他”来代指当事人谷开来和张晓军。微博作者完全避开了这两个人的名字,不是为了给生硬的判决增添凄美的想象空间,而是为了防止微博因使用了“谷开来”等敏感词而被互联网的监管部门删除。
设定敏感词、过滤敏感词,还有避开敏感词的游戏,在中国互联网上并不是件新鲜事。
早在博客和论坛盛行之时,新浪博客、百度贴吧等大型网站就设有“关键词过滤系统”,当用户输入的内容中含有涉及政治、宗教、色情等违规的敏感词时,系统就会禁止内容发表,或是在发表的内容中用“*”等特殊字符将敏感词取而代之。
而随着微博等社交网站这两年的更高速发展,网络敏感词的数量和范围也有了显著的扩大。官方的审查更为精密,这通过国外研究者的统计数据可见一斑。 由加州伯克利大学创办的“中国数字时代”网站,自去年4月起开始收录被新浪微博禁止搜索的敏感词。从去年4月16日到今年8月15日,这个网站上的“新浪微博搜索敏感词列表”共收录了1543个敏感词,换言之,平均每天都有3.2个新的敏感词问世。 按时间顺序来看,这个列表形象地展现出审查机构和网民间“猫捉老鼠”游戏的不断升级。 防审查招数也进入2.0版 以政治敏感词为例,在去年4月初,被屏蔽的多是“中南海” “十七大“这类未经修饰的词条,但渐渐地,“wenjiabao(代指国务院总理温家宝)” “liusi(六四)”等拼音词组也被列入屏蔽范围。今年2月王立军事件爆发后,连“王丽娟护士长(王立军副市长)” “重庆火锅(薄熙来)”这样隐晦的代称都没放过。 敏感词的增加——其中不少是代称,也从一个侧面说明网民“防审查“的招数也在不断改良。可以说,随着互联网进入2.0时代,网民的防审查招数也在转型升级。 用分隔符号或拼音将敏感词略加包装的手法,已经被认为不够安全,或者太沉闷。在讨论敏感议题时,中国微博进入了“代称”时代。 五花八门的代称中,有取自名字谐音的“康师傅”(中共政治局常委周永康)、有源自当事人外貌特征的“墨镜哥”(盲人维权人士陈光诚),有同时表现地理位置与意识形态特征的“西红市” (重庆),更有充满宫廷戏色彩的“平西王”(薄熙来)。 网络观察者的研究显示,这些集合网民智慧、想象力与调侃趣味的代称的产生,可不是因为网民无聊,而是为了防止删帖所做的努力。 曾任美国《商业周刊》驻中国记者的麻省理工大学学生章智竹,最近就利用香港大学新闻及媒体研究中心的微博数据库“微博视野”,搜集了数千条被删除的微博。
|