“中国数字时代敏感词开源研究项目”是《中国数字时代》的一个研究项目,目前在更新新浪微博搜索敏感词列表,请网友参与,提供敏感词线索,共同构建和完善该敏感词列表。
这个链接是数字时代现有的”新浪微博搜索敏感词列表”:http://is.gd/gz6yGn
向网友开源的内容包括:
1. 复测现有列表中词语的敏感性
*复测最小周期为三个月,即在上一次测试三个月之后才可以进行新一次测试。
*结果代码: 1-测试结果为敏感词,0-测试结果为非敏感词。
*提交的时候请写明测试词语,测试时间与测试结果三个要素。
2. 提交暂还没有被纳入列表的敏感词
*提交的时候请写明敏感词(组)与测试时间两个要素(测试时间为在新浪微博搜索中测试的当日日期)。
请以邮件的形式参与,邮件提交时请注意:
*发送到邮箱:minganci110@gmail.com
*邮件标题中含有“敏感词”三个字。
*邮件内容请写明:
1)复测现有词语还是提供新的敏感词(例:复测,XXX,2011.10.18,结果为0;新的敏感词,XXX,2011.10.18)
2)如有需要,也可提供备注(例:“微博”栏目搜索无结果,“找人”栏目搜索显示结果;搜索结果显示不全等)
编辑将根据网友提交的内容对现有敏感词列表做出及时的更新。这是为此项目开通的谷加互动帐号 http://is.gd/ocHWzC ,网友可以在这里与我们进行即时交流。
对本项目有突出贡献的网友,中国数字时代将表示适度感谢。
欢迎您的参与
谢谢!
中国数字时代编辑组