敏感词

敏感词

敏感词设置是中国网络审查的手段之一。中国当局采用敏感词过滤的手段,一些网友输入这些敏感词后会触发屏蔽机制,使得帖子发不出来,甚至会被封号和被请去“喝茶”。一些关键词过滤的主要布置在路由器、应用服务器、终端软件上,对应的应用场合主要有网络访问、论坛、网志、即时通讯、电子邮件等。加拿大多伦多大学公民实验室(Citizen Lab)的研究显示,87%的敏感词与习近平有关。

中国数字空间收藏

GFW敏感词CDT敏感词周报真理馆老大哥馆

CDT视频 CDT播客 CDT大事记 404文库 CDT电子报 CDT征稿 版权说明

中国数字时代收录文章

清哲木:敏感词,不是维稳的天然屏障!

不知道具体从什么时候开始,敏感词成为网络发言的一道屏障;它完全屏蔽了针对某些社会稳定的不良言论;说实话现在的言论自由愈来愈狭隘了;有时候一篇文章涉及多个被认为敏感的词汇;如果修改势必影响整个文章的框架结构和整体表述的内容; 敏感词 俨然成为 …

阅读更多

章立凡:敏感帝国:与网管机器人对话

有网友告知,搜我的博文时发现,“章立凡”已被设为“敏感词”。我自己测试了一下,设置“章立凡”为博客标签时,弹出窗口提示:“你发表的内容包含敏感关键字,不允许发布!”这令我想起一篇网络雄文——《为敏感词服务》,开宗明义说道: 我们的敏感词和敏感词所领导 的敏感词,是革命的 …

阅读更多

何三畏:我想学习“敏感词”

“敏感词”终于成为一个可以公开报道的内容。当我看到搜狐网转载北京日报的报道《搜狐严格过滤不健康内容,每天屏蔽五千微博》时,我深感好奇。“敏感词” 使用多年,使“敏感词”这个词本身,变得不再敏感,尽管“敏感词”都是什么样子,都长在什么部位,仍然不得而知。这就像“网络评论员”(俗称“五毛”)这一个工作或职业,也逐渐变得可以公开谈论,并出现在网络里,写在报纸上,但谁是“网络评论员”,仍然没有人知道。   我想,这样的潜规则的公开,对于网络公司来说,意味着什么呢?现在的企业爱美誉自己为“企业公民”,表示一个有道德人格的主体。那么,网络公司会不会为过去长期使用“过滤词”这一不公开的暗器对付网民而不好意思呢?而这一消息来自北京日报,北京日报应该是很政治主流和政治正确的报纸。它的报道应该有道理。再查,看到搜狐网络自己把它放在显眼位置,还在论坛里作为网民讨论的话题。这说明作为事主,网络公司认为这是光明正大的,视为表扬自己的“正面报道”的。   根据报道,这些“敏感词主要是涉枪、涉黄、涉暴”。“每天屏蔽五千微博”,差不多每十四五条当中,就有一条“不健康”。这真叫人伤心。一但“严格”起来,微博就显得这么黄色和暴力。这么看来,喜欢上微博的人,思想也太“不健康”了。可是,微博不是这个时代最有知识,最有判别力的人在玩吗。如果他们是如此 “不健康”,那么,不意味着我们这个社会,或者说我们这个民族的素质“不健康”吗。或者,是否也说明网络公司“太严格”,敏感词“太敏感”了,才得出这个 “不健康”的诊断呢?   “敏感词”的真容还在敏感中,不能依据它来做评论。但是,它的数量,“主要是涉枪、涉黄、涉暴”的敏感词即有1000多个,这可能太多了,会给微博写作带来极大的麻烦。微博使用的语言是简单的,基本上应该在两千多个不同汉字的范围,而从中又去掉了1000多个字、词或词组,难怪帖子那么容易被过滤。令人困惑的是,汉语词典里涉枪、涉黄、涉暴的字词应有尽有, 假如某微博抄一段而被过滤掉,是否意味着对不起我们的文化?   这里必然产生两个问题。一,为什么需要“敏感词”,它们是怎么产生的,有没有合法的途径?二,如果需要而且合法地产生了“敏感词”,那么,应该怎样使用。很显然,它应该成为“上网须知”,最好是放在网上供网民学习。规定不能背诵60%以上,不能开机。一旦有新的“敏感词”产生了,还要及时增录,广而告知。本人上网的时间不多,但偶尔也被过滤。可是,我自认为我既不黄,也不暴,简直不明白什么原因。所以,我迫切需要学习掌握“敏感词”。 欢迎订阅《政府丑闻》博客! RSS地址: http://feeds.feedburner.com/GoveCN 《政府丑闻》RSS广告: 威众安全路由器,硬件翻墙解决方案! http://bit.ly/9T4yAg UseSSH,为个人提供私密匿名网络访问! http://bit.ly/usessh YesVPN,美国VPN服务包月仅10元! http://bit.ly/YesVPN

阅读更多

“平均每十几条就屏蔽掉一条;监控的敏感词有1000多个”

搜狐网监控中心负责人王国欣告诉记者,包括微博、博客在内的网民互动式互联网产品,文字帖一般采用1000多个敏感词进行过滤,如果其中含有敏感词就直接删除。这些敏感词主要是涉枪、涉黄、涉暴的内容。     据悉,微博被过滤掉的内容,绝大多数是涉黄,另外就是发帖做广告,或者是用语言攻击其他人。王国欣说,搜狐微博是24小时都有人做过滤监控,微博每天出现的七八万个帖子,过滤掉的大约有5000多个。在搜狐社区每天出现的20多万个帖子中,有4万多个会被过滤掉。     除了文字要进行过滤监控,图片过滤也是互联网监控的一个重要内容。王国欣称,搜狐对网民在搜狐社区上传的图片采取软件自动过滤加人工审核的方法,搜狐使用的软件名为图片过滤器,能通过肤色、纹理、动作、人脸等多个参数,对图片进行要素的提取。“人的肤色介于红黄之间,当肤色大于一张图片面积的40%,图片就基本认定为情色图片,进入人工审核程序。”狮子的皮毛是黄颜色,这样的图片会不会直接过滤掉呢?对于这样的疑问,王国欣说,图片过滤的一个选项是纹理,通过软件可以发现狮子的边缘很杂乱,与人体图片的边缘不同,不会被过滤掉。     记者在搜狐公司看到,一位负责网络监控的员工正在进行图片的人工审核。网民上传的照片按照每行5张、每屏40行的标准显示在电脑屏幕上。当发现照片有露点、挑逗动作内容时,他就会在图片下面的方框内点一下,图片就不会上传到网上公开发表了。

阅读更多

你咋不去删搜狐网的原文呢?

通知:您的文章《“平均每十几条就屏蔽掉一条;监控的敏感词有1000多个》中因含有不适当内容,已被设置为私密博文。2010-08-24 21:08 ————————————————- 你咋不去把搜狐网的原文删了呢 : http://it.sohu.com/20100822/n274384538.shtml 搜狐严格过滤不健康内容 每天屏蔽五千条微博 来源: 北京晚报 2010年08月22日15:56   敏感词过滤 组建妈妈评审团 寻找微博安全路径   微博的兴起,使得人们多了一个畅所欲言的场所,但是,一些人却在网上发帖卖假证,有的甚至卖枪弹毒品,这些自然在被禁止之列。昨天,搜狐公司相关人士告诉记者,微博监控有1000多个敏感词,主要是涉枪、涉暴、涉黄等。    上千敏感词监控网络安全   目前,新浪、搜狐、网易、腾讯、人民网等各家网站均提供有微博,上微博发言被网民称为“织围脖”。但是,微博的快速发展也出现了一些问题,一些涉黄、涉暴的内容也在微博上出现。搜狐网监控中心负责人王国欣告诉记者,包括微博、博客在内的网民互动式的互联网产品,文字帖一般采用1000多个敏感词进行过滤,如果其中含有敏感词的就直接删除。这些敏感词有1000多个,主要是涉枪、涉黄、涉暴的内容。“AK47可以说,但是教人怎么做炸药或者直接贩卖枪支弹药毒品的帖子肯定要删除,绝大多数国家都不允许网上出现这种不健康不安全的内容。”   据悉,微博被过滤掉的内容,绝大多数是涉黄,另外就是发帖做广告,或者是用语言攻击其他人。“网络口水战的内容可以发出来,但是‘国骂’就不行了。”王国欣说,搜狐微博是24小时都有人做过滤监控,微博每天出现的七八万个帖子,过滤掉的大约有5000多个。在搜狐社区每天出现的20多万个帖子中,有4万多个会被过滤掉。    图片过滤“软件+人工”   除了文字要进行过滤监控,图片过滤也是互联网监控的一个重要内容。王国欣称,搜狐对网民在搜狐社区上传的图片采取软件自动过滤加人工审核的方法,搜狐使用的软件名为图片过滤器,能通过肤色、纹理、动作、人脸等多个参数,对图片进行要素的提取。“人的肤色介于红黄之间,当肤色大于一张图片面积的40%,图片就基本认定为情色图片,进入人工审核程序。”狮子的皮毛是黄颜色,这样的图片会不会直接过滤掉呢?对于这样的疑问,王国欣说,图片过滤的一个选项是纹理,通过软件可以发现狮子的边缘很杂乱,与人体图片的边缘不同,不会被过滤掉。   记者在搜狐公司看到,一位负责网络监控的员工正在进行图片的人工审核。网民上传的照片按照每行5张、每屏40行的标准显示在电脑屏幕上。当发现照片有露点、挑逗动作内容时,他就会在图片下面的方框内点一下,图片就不会上传到网上公开发表了。    妈妈评审团置顶过滤器   文字和图片过滤,拿捏的火候很难掌握。昨天,搜狐举行“快乐假期,绿色家园”活动,10多位家长和儿童,以及搜狐社区的多位版主来到搜狐公司,现场交流“绿色网络”的建设。搜狐网副总编辑梁春元说,网络在删除一些不良信息的同时,也要保证正常网民不能受到伤害,对于正常的网上交流帖子不能删除,也不能人为耽误上传的时间。   在网络扫黄中,北京网络媒体协会组建的妈妈评审团曾经引起社会关注。昨天,“妈妈评审团”成员之一冯云对这种图片过滤器软件很感兴趣。她认为应该在各家网站大力推广这种软件过滤技术。同时,她希望网站能做出视频过滤器软件,对网上一些不良视频进行过滤。   搜狐媒体副总裁于威说,自己是个两岁女儿的妈妈,搜狐网上的内容是否做到让女儿将来放心上网,现在还不敢说。北京网络媒体协会魏莞说,国内网民数量已经达4.3亿,其中三分之一左右是未成年人,媒体有责任提供健康绿色的内容。“搜狐的好经验值得在全行业进行推广。”   本报记者 贾中山

阅读更多

CDT/CDS今日重点

十月之声(2024)

【404文库】“闭上眼睛,鬼怪并不会因此遁去”(外二篇)

【404媒体】“等帘子拉开,模特已经换上了新衣”(外二篇)


更多文章总汇……

CDT专题

支持中国数字时代

蓝灯·无界计划

现在,你可以用一种新的方式对抗互联网审查:在浏览中国数字时代网站时,按下下面这个开关按钮,为全世界想要自由获取信息的人提供一个安全的“桥梁”。这个开源项目由蓝灯(lantern)提供,了解详情

CDT 新闻简报

读者投稿

漫游数字空间