文章原标题:你还敢用微信吗?不只敏感文字,中国老大哥连图片都有辨识审查手段
作者:赖昀

「老大哥正看着你…的微信!」中国微信(Wechat)在中国的渗透率高达93 %、月活跃用户超过十亿,但你知道微信不只有「文字狱」审查「敏感词」,现在就连透过微信传送的每张图片,也逃不过「老大哥」的敏感资料库监控审查!过去早已不时传出新闻,有人被中国公安传讯,结果对方直接秀出他的私人微信对话内容,让民众对微信的使用者隐私保护感到怀疑。


中国政府对言论的监控无所不在、无孔不入。 (图片取自公民实验室报告)

加拿大多伦多大学研究小组公民实验室(Citizen Lab)日前发表研究报告,发现微信系统针对用户所传送的图像建立庞大且不断更新的资料库,系统会自动监测、辨认出「敏感」图片,将之加入黑名单并删除。微信黑名单的涵盖范围相当广,除了与攸关政治议题的图片之外,美中贸易战、华为财务长孟晚舟的相关图片皆遭封锁,还有许多图片因被系统判定讽刺或贬低了中国人而无法传送。还在用微信传梗图吗?或许看着图呵呵笑的人比你想像的还多呢!

什么样的图片会被加入黑名单?
中国法律要求在中国营运的社交媒体公司必须「控制」其平台上的内容,否则将面临处罚,因此这些网路公司必须「自律」运用技术来「对其服务内容负责」。公民实验室翻阅过往研究资料,发现不同的中国社交媒体进行的审查几乎没有一致标准,此外中国政府也常对一些知名的社交平台直接下令,也因为中国严格审查网路文字,所以许多人试图用传送图片来躲避「老大哥」监控,但这些人很快发现,图片也无法避开审查。公民实验室针对中国最大、每月活跃用户超过 10 亿的社交平台——腾讯微信的聊天功能进行测试,探究微信审查图片的机制和标准。

公民实验室在 7 月 15 日发布的报告指出,除了批评政府的讽刺漫画、官员丑闻的相关照片之外,微信后台还会挡掉与以下 11 个新闻或历史事件的相关照片:

ㄧ、文化大革命1

二、1989 年六四天安门事件2

三、范冰冰逃税丑闻3

四、2018 年重庆客车撞车事故4

五、2018 年美国选举5

六、最高人民法院丑闻6

七、华为财务长孟晚舟被捕事件7

八、美中贸易战8

九、基因改造婴儿9

十、2019 年成都七中食堂丑闻10

十一、2019 年成都森林大火11

公民实验室指出,微信定义黑名单的标准不明,除了具有政治意涵的图片,例如2010 年诺贝尔和平奖颁奖典礼上为刘晓波保留的空椅子、波兰主持人在节目上表达支持台湾等新闻照片之外,一篇作者自述其向​​母亲出柜经验的文章中的配图「鸵鸟的逃避」也被微信封锁,公民实验室认为原因可能是图片有讽刺中国人逃避麻烦的「鸵鸟心态」之嫌。还有一些图片没有被列入黑名单的明确理由,却也同样遭到封锁,其中一个案例是著名灵长类动物学家珍古德(Jane Goodall)与一只婴儿黑猩猩的照片,公民实验室猜测封锁原因可能是系统认为黑猩猩的照片是对中国人的种族歧视。

被封锁的图片「鸵鸟的逃避」(图片取自公民实验室报告)

另外公民实验室还发现遭到微信删除的公开文章中所使用的配图都会另外被系统加进黑名单,即使图片本身并没有「敏感」内容,其中甚至有许多是取自中国官方网站的官员照片和政策公告的截图。公民实验室认为,微信母公司腾讯可能过度审查其认为政治敏感或会引起公众「不必要的关注」的事件相关图片。

私聊、群聊和朋友圈各自有独立资料库
公民实验室经测试发现,微信的三种主要社交功能:一对一的私聊、多人群组聊天、用户发表即时动态的朋友圈,皆会被后台系统建立独立的资料库并以不同标准进行审查,大部分无法在朋友圈发布的图片同样也无法在聊天群组中传送,但有一部分朋友圈的「禁图」可以透过私聊传送。每张出现在微信的图片都会被记录在微信后台庞大的hash12资料库,但是否列入黑名单似乎在三项功能中标准不一,影响力较大、会接触到人群、可能让内容被广传的朋友圈受到的审查最严,其次是群组聊天,一对一私聊相对之下审查略微宽松。

另外,公民实验室还发现微信审查的对象针对中国境内的用户,在使用分别以中国手机号码注册和以加拿大手机号码注册的两个微信帐号进行测试时,许多传送的图片中国帐号无法收到,但是加拿大号码都能顺利收到。另外,图片被挡时微信系统也不会作出提醒,传送人依然能看到图片出现在对话框,但是接收人什么也看不到,也不会知道对方尝试传送图片。


公民实验室发现微信对中国国内外的用户审查的标准不同。 (图片取自公民实验室报告)

公民实验室还想确认同为腾讯公司旗下的另一个社交平台QQ 空间13是否与微信共享黑名单,经过测试发现在QQ 空间被挡的30 张图片有24 张同样也被微信朋友圈封锁,重复率高达84%,之后用同一批图片进行第二次测试时,则有27 张图片无法发布,重复率上升到93%,公民实验室推测这两个社交平台可能共用同一份黑名单,只是新旧版本的不同。

中国微信如何进行审查?
公民实验室测试后发现,微信透过建立每张图片的Hash 索引资料库,检查并记录每张图片档案的MD514编码,并将其中具有「敏感」内容的图片列入黑名单,让用户无法在微信上传送这类图片。公民实验室设法在一张画有中国民主人士刘晓波的漫画(敏感内容)和另一张公民实验室的标志图片(非敏感内容)的档案中加入了相同的MD5 编码,测试发现两张照片都无法用微信传送。

左为中国民主人士刘晓波的漫画(敏感内容),右为公民实验室的标志图片(非敏感内容),加入了相同的 MD5 编码后,两张照片都无法用微信传送。 (图片取自公民实验室报告)

微信利用Hash 索引来过滤平台上的「敏感图片」,虽然Hash 索引并不是一种灵活的辨认程式,一旦图片档案的原始数据被稍微更改,其Hash 数值就会被改变,但是公民实验室发现如果微信用户在传送图片时没有特别选择「发送原图」,微信系统就会对图片进行压缩,并在过程中对图片重新编码。经过微信重新编码的「敏感」图片,即使经过修改,也无法再在微信上传送,因为编码已经被微信系统记录。若用户传送一张hash 资料库中没有的「新图片」,系统会准许传送,但这张图片也将自动列入「待审查」队伍,由系统检测有无「敏感」内容,随后就无法再正常传送。


经过微信重新编码的图片,其编码已经被微信系统记录。 (图片取自公民实验室报告)

公民实验室尝试对「敏感图片」档案进行修改,包括调色、降低画素、增加黑格等方式,为每张投入测试的「敏感图片」做出10 个有微小差异的版本,测试微信系统是否会将被改过的档案过滤掉。结果发现,即使有部分动过手脚的「敏感」图片在第一次测试时骗过微信系统顺利传送,但也在短时间之内被系统识别、加入黑名单。公民实验室的测试为期一个月,总共制作了 30 张经过微调的图片,在实验结束的时候没有任何一张可以在微信传送。

最后由于公民实验室使用的微信帐号大量传送「敏感」图片,被微信系统关闭,而申请新帐号非常困难,公民实验室表示新帐号必须被另一个帐号批准,而另一个帐号必须存在六个月、「信誉良好」、一个月内未批准其他帐号成立,因此无法再在微信上进行更多测试。

 

相关链接:“未阅先焚”2:微信如何实现实时审查用户对话中的敏感图片

 

 

 

相关阅读: