敏感词库|新浪微博搜索禁词:“占领系列” 2011-10-20

[测试时间:2011年10月20日,在此时间点,以下所有词语均为新浪微博搜索禁词]

占领中国

省会城市系列:占领北京,占领上海,占领广州,占领西安,占领重庆,占领天津,占领乌鲁木齐,占领拉萨,占领长沙,占领武汉,占领南昌,占领福州,占领南京,占领杭州,占领哈尔滨,占领成都,占领昆明,占领呼和浩特,占领海口,占领郑州,占领长春,占领沈阳,占领西宁,占领兰州,占领太原,占领银川,占领石家庄,占领济南,占领海口,占领南宁

非省会城市系列:占领大连,占领吉林,占领深圳,占领温州,占领青岛

【注:省会中只有 合肥 与 贵阳 不在列表内。】

地区系列:占领王府井,占领中南海,占领金融街

————

附 参与说明

欢迎网友参与“中国数字时代敏感词开源研究项目”

Google Doc版:http://sn.im/caonima866

“中国数字时代敏感词开源研究项目”是《中国数字时代》的一个研究项目,目前在更新新浪微博搜索敏感词列表,请网友参与,提供敏感词线索,共同构建和完善该敏感词列表。

这个链接是数字时代现有的”新浪微博搜索敏感词列表”:http://sn.im/caonima439,向网友开源的内容包括:

1. 复测现有列表中词语的敏感性

*复测最小周期为三个月,即在上一次测试三个月之后才可以进行新一次测试。

*结果代码: 1-测试结果为敏感词,0-测试结果为非敏感词。

*提交的时候请写明测试词语,测试时间与测试结果三个要素。

2. 提交暂还没有被纳入列表的敏感词

*提交的时候请写明敏感词(组)与测试时间两个要素(测试时间为在新浪微博搜索中测试的当日日期)。

请以邮件的形式参与,邮件提交时请注意:

*发送到邮箱:[email protected]

*邮件标题中含有“”三个字。

*邮件内容请写明:

1)复测现有词语还是提供新的敏感词(例:复测,XXX,2011.10.18,结果为0;新的敏感词,XXX,2011.10.18)

2)如有需要,也可提供备注(例:“微博”栏目搜索无结果,“找人”栏目搜索显示结果;搜索结果显示不全等)

编辑将根据网友提交的内容对现有敏感词列表做出及时的更新。这是为此项目开通的谷加互动帐号 http://sn.im/caonima864,网友可以在这里与我们进行即时交流。

对本项目有突出贡献的网友,中国数字时代将表示适度感谢。

欢迎您的参与
谢谢!
中国数字时代编辑组

2011年10月20日, 5:19 下午