“中国数字时代敏感词开源研究项目”是《中国数字时代》的一个研究项目,目前在更新新浪微博搜索敏感词列表,请网友参与,提供敏感词线索,共同构建和完善该敏感词列表。

这个链接是数字时代现有的”新浪微博搜索敏感词列表”:http://is.gd/gz6yGn

向网友开源的内容包括:

1. 复测现有列表中词语的敏感性

*复测最小周期为三个月,即在上一次测试三个月之后才可以进行新一次测试。

*结果代码: 1-测试结果为敏感词,0-测试结果为非敏感词。

*提交的时候请写明测试词语测试时间测试结果三个要素。

2. 提交暂还没有被纳入列表的敏感词

*提交的时候请写明敏感词(组)测试时间两个要素(测试时间为在新浪微博搜索中测试的当日日期)。

请以邮件的形式参与,邮件提交时请注意:

*发送到邮箱:minganci110@gmail.com

*邮件标题中含有“敏感词”三个字。

*邮件内容请写明:

1)复测现有词语还是提供新的敏感词(例:复测,XXX,2011.10.18,结果为0;新的敏感词,XXX,2011.10.18)

2)如有需要,也可提供备注(例:“微博”栏目搜索无结果,“找人”栏目搜索显示结果;搜索结果显示不全等)

编辑将根据网友提交的内容对现有敏感词列表做出及时的更新。这是为此项目开通的谷加互动帐号 http://is.gd/ocHWzC ,网友可以在这里与我们进行即时交流。

对本项目有突出贡献的网友,中国数字时代将表示适度感谢。

欢迎您的参与
谢谢!
中国数字时代编辑组