敏感词

敏感词

敏感词设置是中国网络审查的手段之一。中国当局采用敏感词过滤的手段,一些网友输入这些敏感词后会触发屏蔽机制,使得帖子发不出来,甚至会被封号和被请去“喝茶”。一些关键词过滤的主要布置在路由器、应用服务器、终端软件上,对应的应用场合主要有网络访问、论坛、网志、即时通讯、电子邮件等。加拿大多伦多大学公民实验室(Citizen Lab)的研究显示,87%的敏感词与习近平有关。

中国数字空间收藏

GFW敏感词CDT敏感词周报真理馆老大哥馆

CDT视频 CDT播客 CDT大事记 404文库 CDT电子报 CDT征稿 版权说明

中国数字时代收录文章

【敏感词库】 “误邦国”、“上浦”等近日热点 2013-3-8

[测试时间:2013年3月08日,在此时间点,以下所有词语均为新浪微博搜索禁词(不包括“找人”)] (编者注:新浪微博在类似的重大舆论热点事件上常会实时调整审查策略,因而其搜索敏感词也时常会发生变化。本列表只限于截稿时的测试结果,测试截图请移步本项目G+页面。 ) 上浦(新闻背景:金融时报 | 广东上浦村:下一个乌坎?) 棉湖(同上) 吴邦国别称种种(背景新闻:【网络民议】吴邦国,说好的为人民服务呢?): 吴绑国 吴帮国 误帮国 无帮国 无邦国 误邦国...

阅读更多

Solidot | 研究估计新浪微博审查大军四千余人

新浪微博是中国最大最流行的微博平台,注册用户据说达到了五亿,基本上每个中国网民都注册了一个帐号。不同于西方的Twitter,新浪微博必须承担起审查任务。休斯顿莱斯大学的研究人员收集了数百万帖子,分析和识别新浪微博审查员(或者叫微博小秘书)的规模和删贴速度。论文(PDF)发表在预印本网站arxiv上。研究人员观察到,三成的删贴活动发生在发帖后5到10分钟内,九成的删贴发生在24小时内。假设新浪微博的一个审查员平均每分钟能阅读50个帖子,那么扫描每分钟涌入的7万新帖子新浪需要有1400人同时工作,假设他们每天工作8小时,那么需要有4200人才能满足审查需要。 鉴于微博API的限制,研究人员主要跟踪了最可能会发敏感帖子的敏感用户组。从2012年7月20日到9月8日,研究人员利用API以每分钟一次的频率搜索3500位用户的时间线,以每四秒一次的频率搜索公共时间线。由于新浪微博不支持匿名查询,所以他们利用Tor隐藏IP后创建虚假用户帐号。他们共收集了238万用户时间线帖子,删贴率是12.75%。考虑到新浪需要处理的大数据集规模,发帖后5到10分钟的删贴峰值,尤其是考虑到删贴无法完全用自动方式处理,新浪是如何做到迅速发现和删除敏感帖子?研究人员提出了六个假说:

阅读更多

【敏感词库】“长春禁令”“送温神” 等热点2013-3-6

长春+禁令(详情请见:吉林:”3.04″案件省直及长春市媒体报道要求)
长春+报道要求(同上)
接班(背景阅读:【网络民议】悬念的最高境界:人大将选举国家主席)
温家宝+卸任(背景阅读:完美谢幕?新浪微博严格审查过滤温家宝相关评论)
温+十年(同上)
执政+十年(同上)
送温神(同上;送“瘟神”或“温神”均为网上常见的对温家宝的贬称)
瘟神(同上)
X产党(网民常用的“共产党”贬称如“哄产党”、“垬产党”等都一并被过滤)

复测:
一党独裁(“独裁”一词目前处于解禁状态)

备注:所有中文词语在测试时都为简体。繁体搜索结果偶尔会有不同。

阅读更多

CDT/CDS今日重点

【CDT月度视频】三月之声(2025)——“老百姓没有活路”

【404文库】“建议最爱国的华为公司或者鸿星尔克公司去找李嘉诚竞价”(外二篇)

【CDT关注】“哦,那个死去的医生”(外二篇)

更多文章总汇……

中国无差别袭击案件受害者纪念墙

我们建立了这个无差别袭击案件受害者纪念墙,持续记录全国各地的无差别袭击案,并纪念和哀悼这些案件的受害者。

CDT专题

支持中国数字时代

蓝灯·无界计划

现在,你可以用一种新的方式对抗互联网审查:在浏览中国数字时代网站时,按下下面这个开关按钮,为全世界想要自由获取信息的人提供一个安全的“桥梁”。这个开源项目由蓝灯(lantern)提供,了解详情

CDT 新闻简报

读者投稿

漫游数字空间