【敏感词库】鸟巢、玲珑塔、五月天演唱会、独立宣言
一名女子于6月3日在北京“鸟巢”国家体育场外的玲珑塔上挥舞带美国国旗的标语并抛洒传单。传单内容为美国《独立宣言》选段和“致同胞们的一段话”。抗议发生后,微博将“五月天演唱会”、“鸟巢”设为先审后发词,即包含相关内容的微博须经审查后才可公开。搜索结果显示,6月3日包含相关敏感词的微博中,仅加V用户发布的内容可见,普通用户不可见。“玲珑塔”被设为违禁词,搜索结果几乎被完全清空。“独立宣言”仅可见蓝V所发内容,全部搜索结果不足40条。
中国数字时代敏感词开源研究项目”是《中国数字时代》的一个研究项目,目前在更新新浪微博搜索敏感词列表,请网友参与,提供敏感词线索,共同构建和完善该敏感词列表。
2023年6月3日
一名女子于6月3日在北京“鸟巢”国家体育场外的玲珑塔上挥舞带美国国旗的标语并抛洒传单。传单内容为美国《独立宣言》选段和“致同胞们的一段话”。抗议发生后,微博将“五月天演唱会”、“鸟巢”设为先审后发词,即包含相关内容的微博须经审查后才可公开。搜索结果显示,6月3日包含相关敏感词的微博中,仅加V用户发布的内容可见,普通用户不可见。“玲珑塔”被设为违禁词,搜索结果几乎被完全清空。“独立宣言”仅可见蓝V所发内容,全部搜索结果不足40条。
2023年5月17日
2023年5月,有匿名网友向中国数字时代投稿了一份本年1季度部分微博敏感话题清单,总共包含47个敏感词组,内容总量庞大。中国数字时代对清单中的全部敏感词进行了检索验证,并挑选了一部分与读者分享。
2023年2月18日
喜剧演员池子(本名王越池)近日遭中国多个平台同时封杀,或为网信办指示下的统一行动。“池子”在微博被禁搜,仅显示少量蓝V发言,其本名“王越池”无法找到任何结果。其百度百科、豆瓣页面均被下线。
2023年2月15日
武汉再度爆发反医保改革的大规模示威之后,中国数字时代测试发现,微博连续将多个相关话题封禁。例如,“#武汉医保”、“#武汉 医保”、“#武汉中山公园”、“#医保个人账户缩水能不能有补偿方案”、“#武汉医保改革”、“#武汉医保改革重大调整”这六个话题均被审查。
2023年1月7日
“人矿”一词被全网封杀。各平台审查部署时间一致,审查方式较为相似,且未产生大量衍生敏感词,应为响应网信办统一发布的指令。新浪微博将“人矿”一词完全禁搜并清理,仅可检索到一条相关微博。之前登上热搜第11位的#人矿 话题被下线,文案显示为:“根据相关法律法规和政策,话题页未予显示。”但同时微博禁搜规则较简单,“人 矿”、“Humineral”、“Renmine”等写法未被禁搜。
2023年1月4日
目前,新浪微博将“辱华”一词设为禁搜,仅可见蓝V(机构和媒体账号)发布的30条微博。微信公众平台“辱华”的全部相关文章仅为2018年至2022年10月之间的不足100篇,且大部分为官媒发布或“阅读10万+”文章。
2022年11月27日
新浪微博将“白纸”一词设为禁搜词,包含该词的新发布内容无法被搜索到。微信公众平台则采取了仅限蓝V可见的准禁搜方式审查。此外,在微信发布“白纸”图片可能遭到账号冻结处理。
2022年11月25日
11月25日,中国领导人习近平就所罗门群岛遭受地震向所罗门群岛总督致慰问电,而就在此前一天的乌鲁木齐火灾仍令网民悲愤交加。因网民批评或新闻撞车早有舆情预警,新浪微博将“所罗门群岛”一词设为禁搜,仅可见蓝V账号发言
2022年11月16日
该事件立即引起墙内各平台的审查行动。微博将“特鲁多”、“加拿大总理”、“Trudeau”设为禁搜,仅可见蓝V,即机构和媒体发布的内容。中国网民对特鲁多的昵称“小土豆”甚至也同样被禁搜,封禁力度较大。
2022年11月14日
“躺匪”一词被多个平台封禁。微博完全禁搜,且不同于常见的“仅V用户可见”,而是返回明确的禁搜文案如“根据相关法律法规和政策,搜索结果未予显示。”知乎则无法显示“躺匪”的按时间排序结果。B站和抖音仅能找到无关的内容。
2022年11月4日
11月2日,北京青年报社旗下微博账号“北京头条”在转发北京警方的一条通告时附上话题 #北京一女子致2700余人被临时管控。其中一位名为 @毕达哥拉斯的远方亲戚 的用户戏仿标题评论道:“北京一男子致14亿人受长期管控”。“北京一男子”随后遭到微博禁搜。
2022年10月23日
2022年10月16日至22日,中共二十大在北京召开。因此前的北京四通桥抗议,中国社交网络上的审查压力剧增。在会议期间,又出现了数次有针对性的大范围审查,中国数字时代测试了相关敏感词并总结如下
2022年10月17日
10月16日上午十点,中共二十大在北京召开。在最高领导人习近平接近2个小时的开幕讲话中,照例出现了数个口误。中国网络审查部门对此密切关注,在每个口误出现的短时间内即采取审查措施。
2022年10月13日
目前已有多个平台已将“四通桥”设为禁搜禁发。此外,“海淀”、“勇士”在微博遭禁搜,“横幅”、“条幅”、“标语”等在微博的搜索结果遭到筛查,“不要核酸要吃饭”等横幅文案在各平台均无法找到相关内容。
2022年8月24日
16岁大熊猫“翠翠”产下“世界最重圈养大熊猫宝宝”官媒新闻意外引发了大量网民“辱包冲塔”,最终央视新闻将评论区关评,进行同样操作的还有@环球时报。微博已同时将两个话题设置了人工审查。早在2020年2月,一些网民用“祈翠”来表达对习近平健康状况的期待令该词成为了网络敏感词。
2022年8月19日
每禁一个脏词,就有另一个词被污染,中文的脏话同样经历了各种演变。网民的智慧也不断在“反反脏话机制”上大放异彩,脏话的演变俨然一部文明进化史。这种强行“非礼勿言”的恶性循环就像关停全世界的厕所,所有人只能随地大小便,直至再也找不到一寸净土的那天。
2022年7月14日
近日,一份展示中国社交平台小红书审查知识库的文件被泄露,其中含有实施审查的大量细节。这份长达143页的文件描述了小红书监测舆情的方式,以及在长达数月的时间里所积累的舆情案例,而后将其提取敏感词,以便其审查员更高效地审查平台上2亿个月活跃用户所产生的海量内容。
2022年6月4日
在微博出现短暂的“It’s my duty”刷屏后,该词最终被完全屏蔽,以关键词进行检索不显示任何相关内容。有网民尝试使用中文的“麦丢替”替代“my duty”以躲避微博审查,这些内容也疑被全面删除。
2022年4月23日
尝试在微博搜索“四月之声”会发现“查无任何结果”,知乎搜索“四月之声”会反馈“未搜索到相关内容”。有许多微博用户将ID改为包含这一关键词,表达对网络审查的抗议。
2022年4月18日
网民开始使用各种话题标签绕过对上海封城政策的内容审查……而随着网民创造性反抗的深入,中国国歌的第一句“#起来不愿做奴隶的人们”也在微博上遭封禁。
2022年3月28日
3月28日,有电报读者@Don Kenny 投稿,几名学生在日常对话中发现了一个所谓的“微信bug”,即在聊天中发布“200斤饺子+你想说的话”,对方将会接收不到任何内容,遭到微信平台的信息拦截。
2022年2月14日
2月11日,严歌苓在做客周孝正《文明客厅》节目时,就“徐州八孩母亲”一事展开对话,在谈及中国政府收取高额涉外领养费时,严歌苓附和了周孝正所说的“习近平就是人贩子”这句话,还爆出粗口。这段视频内容开始在墙外平台热转,人们很快发现微博将“严歌苓”列入了禁搜词,尝试搜索会显示“根据相关法律法规政策,搜索结果未予显示”。此外,话题“#严歌苓”也被禁搜,超话已不存在。
2021年12月8日
当你结束一天的辛苦工作,晚上9点从公司回家,准备在微博上吐槽一句:“实习狗加班好累”,却发现这句吐槽因为“违反相关法律法规”无法发出…
2021年8月31日
该文来自电报频道简中赛博坟场,作者记录总结了长期以来新浪微博内容审查的诸多手段,总分为7个大类,细分为32种情形,附带了大量具体范例截图,是一份颇有价值的审查研究文本。
2021年4月30日
4月29日,有推特用户发现在苹果中国的网站上(apple.com.cn)购买最新数码产品——防丢追踪器AirTag的时候,官方提供了“个性风格选项”,使得用户可在AirTag上镌刻个人指定的文字、符号、数字等,但很显然苹果中国禁止了大陆用户使用某些敏感词。
2021年2月26日
2021年的元宵节开始,中国数字时代将在脸书上推出【敏感词日历】企划,每日一词,将这些珊瑚礁(X)敏感词(O)与台湾农民历结合,捡拾被删除的语言、智慧与批判之声,重新将它带回当下的时空里,陪伴我们的每一天。
2020年11月26日
本周敏感词包括“中国感恩节”、“习近平祝贺拜登当选”的相关内容。
11月25日是一年一度中国网友戏谑的“中国感恩节”、“蛋炒饭节”,这一节日的起源与“毛岸英之死”的某种传言有关,还产生了“吃蛋炒饭”纪念的“行为艺术”。当然,这一话题在中文互联网上高度敏感,相关讨论常常被清理。
11月25日中国官方媒体还报道了“习近平致电祝贺拜登当选总统”,此前中国外交部发言人虽有表态但北京方面始终保持“沉默”。习近平的致贺相比其他领导人晚了数周。在中美关系的困境时期,这一消息同样被禁止展开讨论。
2020年11月7日
本周敏感词包括马云被约谈、美国大选等相关内容。蚂蚁集团原计划于11月5日在上交所科创板和港交所同步上市,两地总计募资总额出超过345亿美元(约2400亿元人民币),总市值高达2.1万亿元,成为有史以来全球最大的IPO项目。但上市前夕,蚂蚁集团实际控制人马云、董事长井贤栋、总裁胡晓明等被监管部门约谈,沪港上市被双双叫停,受此影响,其母公司阿里巴巴股价当日也暴跌8%。外界普遍认为,这次约谈与马云10月24日在外滩金融峰会的演讲有关,他在演讲中批评中国不是存在金融系统性风险,而是缺乏金融系统的风险。
2020年10月22日
1. 钟南山
敏感度:禁止负面内容。
除了抖音视频评论有较隐晦的质疑之外,所有搜索结果未见对钟南山的批评或质疑。
微博将同时涉及“钟南山+板蓝根”,“钟南山+白云山”的多条新闻关闭评论,并将疑似“翻车”的评论及转发设为不可见。
但是微信等网络平台仍然存在大量避开关键词“钟南山”的批评文章。
2. 泰国
敏感度:禁止攻击现行体制,限制联系香港。
“泰国+香港”在抖音搜索仅有少量陈旧内容。各平台均没有正面展示泰国抗议活动的图片和视频。
“三大诉求”在各平台遭到清理,仅保留符合中国官方的解读。
3. 卡扎菲
敏感度:限制讨论。
“阿拉伯之春”遭到清理。
“茉莉花革命”仍为各平台的违禁词。
2020年10月14日
1. 拉姆
敏感度:新浪微博审查词,即相关话题会遭到人工审查。“微博实时热点”及“微博热门话题”栏目均有展示“头部用户(KOL,俗称‘大V’)”对此事件的讨论,但是由此“攻击现行体制”和“涉警”的言论则被清理。
2. 拉姆法案
敏感度:审查词。话题取消——也就是说,“#“(话题标签,Hashtag)的功能会失效,从而阻止话题的组织和展开。不上热门。
3. 警察+不作为
敏感度:审查词,相关话题会遭到人工审查。新浪微博仅有“热门”栏目展示内容,无法搜索。抖音搜索可见更多内容,但无负面信息。
4.
华南理工强奸案
敏感度:审查词。受害人哭诉视频及音频在新浪微博被清理。搜索结果以通稿为主。
5. 任志强、任大炮
敏感度:审查词。新浪微博和知乎都“先审后发”,只有少量内容能通过审查,能检索出来的内容以新闻通稿为主,且自动禁止互动。抖音禁止搜索。
2020年9月25日
9月24日,一名推特网友自曝因在QQ群发布了一条“调侃习近平”的段子而被“喝茶”。从截图来看,这名网友的职业应为“技术类运营维护人员”,被约谈地点在武汉市公安局硚口区分局。...
2020年9月22日
CDT编辑发现《北京晚报》转发评论设置出现疏漏,成为新浪微博上罕见的、甚至可能是唯一能留下网民评论的地方——如果读者发现更多,欢迎来信告知。
2020年9月15日
9月14日,新浪微博本地博主 @北京人捍卫北京城 的一条揭露车辆逆行的微博,因拍摄到的车辆牌照号特殊(包含8964),图文消息很快在新浪微博遭到“禁评”。...
2020年8月9日
8月8日,有网友发现在新浪微博上一段正常的“救助弃犬”的信息无法正常发出,经测试发现禁发敏感词为“狗共”,而这段信息中“狗共”实为“狗,共”,完全是网友消息的无意触发。该词是如何被纳入了“新浪微博禁发...
2020年7月10日
对各级领导同志的各种活动报道,慎用“亲自”等词。除了党中央国务院召开的重要会议外,一般性会议不用“隆重召开”字眼。
2020年5月11日
5月11日,有推友发起“敏感词测试”活动,称有两段文字在豆瓣说因触及“敏感词”而无法直接发出,受到内容的后续人工审核,希望大家可以“看图找词”。多名网友表示“题目太难”,难以找出所涉敏感词。...
2020年4月29日
4月28日,有网友反馈在闲鱼(阿里巴巴旗下的二手闲置品交易平台)意外发现一段涉及主板的交易信息无法正常发出,进而发现“后主”一词竟被列为禁发敏感词。很显然该词的设置与习近平有关。...
2020年3月27日
3月27日,有网友测试发现,在新浪微博平台上无法发出“美国加油”的文字内容,会提示:“此内容存在违反相关法律或《微博社区公约》的信息,无法进行当前的操作。”似乎已将该关键词纳入了发布禁词。 截至发稿时(北京时间2020年3月27日 16:47分)已有多名网友对此进行了测试,,证实该发布限制确实存在: “美国加油”四个字已违反法律法规…… 我微博账号已被封杀干净,哪位推友测试下? pic.twitter.com/WuoQGYSwXm —...
2020年3月4日
有研究发现,微信等中国社交平台早于去年12月,过滤疫情相关内容,敏感词包括“武汉海鲜市场”丶“习近平到武汉”和“李文亮”等。学者指出,言论审查令民众未能及时防疫。
2020年2月25日
过敏源就是“人民”这个词!按微博这操作逻辑,好像阔以建议我们的合作方广西人民出版社改下名字了,下列名目仅供参考:
广西公民出版社
广西民众出版社
广西群众出版社
广西皮破出版社
广西没有出版社
2020年2月8日
近日,部分网民因对中国政府在“新冠病毒”疫情中的表现极为愤怒,将矛头直指“亲自部署亲自指挥”的习近平,创造性地在社交平台开始转发“翠”这个字,其含义为该字的拆解:“习卒”或“习二卒”。又有人称“习卒习”发音类似“习主席”。这些都形象地表达了部分网友对习近平健康状况的某种期待。 新浪微博上甚至还出现了“每日祈翠超话”,当然话题的出现也仅是昙花一现。不少网友因转发或参与此话题遭到账号封禁。...