敏感词库|新浪微博搜索禁词:北京年终奖提前,茉莉花及其他 2011-11-27_

 

[测试时间:2011年11月27日,在此时间点,以下所有词语均为新浪微博搜索禁词(不包括“找人”搜索结果)]

热点词:+年终奖(任何含有这两个词的组合均无法搜索;详情请搜索“北京要求国企提前发年终奖”。目前发现已有不少门户网站的相关文章被删除。)

编辑高亮词:Jasmine*

其他:裆中央江罗(比较常见的“江泽民与罗干”简称),茉莉花革(显然是因为“茉莉花革命”)

*Jasmine 为英语里“”的意思,也是一个常见的女名。Jasmine成为敏感词有2种可能:1) 和茉莉花革命有关;2) 和贾庆林的同名外孙女Jasmine Li有关。

然而经过复测后,数字时代编辑发现原本在2011年8月10日曾经是敏感词的“茉莉花”一词已经开禁;如今取而代之的与该话题相关的敏感词是“茉莉花革”。本编辑因此大胆推测,上述的第二种解释成立的可能性很高。


备注:所有中文词语在测试时都为简体。繁体搜索结果偶尔会有不同。

—————–
附 参与说明

欢迎网友参与“中国数字时代敏感词开源研究项目”

Google Doc版:http://sn.im/caonima866

“中国数字时代敏感词开源研究项目”是《中国数字时代》的一个研究项目,目前在更新新浪微博搜索敏感词列表,请网友参与,提供敏感词线索,共同构建和完善该敏感词列表。

这个链接是数字时代现有的”新浪微博搜索敏感词列表”:http://sn.im/caonima439,向网友开源的内容包括:

1. 复测现有列表中词语的敏感性

*复测最小周期为三个月,即在上一次测试三个月之后才可以进行新一次测试。

*结果代码: 1-测试结果为敏感词,0-测试结果为非敏感词。

*提交的时候请写明测试词语,测试时间与测试结果三个要素。

2. 提交暂还没有被纳入列表的敏感词

*提交的时候请写明敏感词(组)与测试时间两个要素(测试时间为在新浪微博搜索中测试的当日日期)。

请以邮件的形式参与,邮件提交时请注意:

*发送到邮箱:[email protected]

*邮件标题中含有“”三个字。

*邮件内容请写明:

1)复测现有词语还是提供新的敏感词(例:复测,XXX,2011.10.18,结果为0;新的敏感词,XXX,2011.10.18)

2)如有需要,也可提供备注(例:“微博”栏目搜索无结果,“找人”栏目搜索显示结果;搜索结果显示不全等)

编辑将根据网友提交的内容对现有敏感词列表做出及时的更新。这是为此项目开通的谷加互动帐号 http://sn.im/caonima864,网友可以在这里与我们进行即时交流。

对本项目有突出贡献的网友,中国数字时代将表示适度感谢。

欢迎您的参与

谢谢!

中国数字时代编辑组