Personal tools
Views

Difference between revisions of "新浪微博敏感词"

From China Digital Space

Jump to: navigation, search
Line 3: Line 3:
 
==== [http://chinadigitaltimes.net/2013/06/two-years-of-sensitive-words-grass-mud-horse-list/ 新浪微博搜索敏感词] (更新中)====
 
==== [http://chinadigitaltimes.net/2013/06/two-years-of-sensitive-words-grass-mud-horse-list/ 新浪微博搜索敏感词] (更新中)====
  
“中国数字时代敏感词开源研究项目”是《中国数字时代》的一个研究项目,目前在更新新浪微博搜索敏感词列表,请网友参与,提供敏感词线索,共同构建和完善该敏感词列表。
 
  
这个链接是数字时代现有的[http://sn.im/caonima439 ”新浪微博搜索敏感词列表”],向网友开源的内容包括:
+
《中国数字时代》从2011年起开始搜集整理新浪微博搜索禁词,是依靠网友集体智慧的开源项目。2013年~2014年期间,新浪微博开始逐渐减少搜索禁词的设置,并更多地采取较隐蔽的审查方式,比如在用户不知情的情况下转为仅自己可见,或者更精准地过滤搜索结果等。到2014年后期,设置搜索禁词已经成为微博紧急情况下(如删帖量过大)才会采取的应对措施。从2017年起,本站开始同时搜集整理新浪微博禁发词,目前也以列表的形式添加到搜索禁词的公开表格中:[https://docs.google.com/spreadsheets/d/1UTP9MU80r_N5WPhQ5-4AjM0ebW1eMxyDlRe_vaYy9IM/edit?usp=sharing 历年禁词汇总]
 
 
1. 复测现有列表中词语的敏感性
 
 
 
*复测最小周期为三个月,即在上一次测试三个月之后才可以进行新一次测试。
 
 
 
*结果代码: 1-测试结果为敏感词,0-测试结果为非敏感词。
 
 
 
*提交的时候请写明测试词语,测试时间与测试结果三个要素。
 
 
 
2. 提交暂还没有被纳入列表的敏感词
 
 
 
*提交的时候请写明敏感词(组)与测试时间两个要素(测试时间为在新浪微博搜索中测试的当日日期)。
 
 
 
请以邮件的形式参与,邮件提交时请注意:
 
 
 
*发送到邮箱:[email protected].com
 
 
 
*邮件标题中含有“敏感词”三个字。
 
 
 
*邮件内容请写明:
 
 
 
1)复测现有词语还是提供新的敏感词(例:复测,XXX,2011.10.18,结果为0;新的敏感词,XXX,2011.10.18)
 
 
 
2)如有需要,也可提供备注(例:“微博”栏目搜索无结果,“找人”栏目搜索显示结果;搜索结果显示不全等)
 
 
 
编辑将根据网友提交的内容对现有敏感词列表做出及时的更新。这是为此项目开通的[http://sn.im/caonima864 谷加互动帐号],网友可以在这里与我们进行即时交流。
 
 
 
对本项目有突出贡献的网友,中国数字时代将表示适度感谢。
 
 
 
欢迎您的参与
 
 
 
谢谢!
 
 
 
中国数字时代编辑组
 
  
 +
在推特关注、私信我们:[https://twitter.com/CDTChinese/ @CDTChinese]
  
 
==陈光诚==
 
==陈光诚==

Revision as of 04:19, 27 February 2018

欢迎网友参与“中国数字时代敏感词开源研究项目”

新浪微博搜索敏感词 (更新中)

《中国数字时代》从2011年起开始搜集整理新浪微博搜索禁词,是依靠网友集体智慧的开源项目。2013年~2014年期间,新浪微博开始逐渐减少搜索禁词的设置,并更多地采取较隐蔽的审查方式,比如在用户不知情的情况下转为仅自己可见,或者更精准地过滤搜索结果等。到2014年后期,设置搜索禁词已经成为微博紧急情况下(如删帖量过大)才会采取的应对措施。从2017年起,本站开始同时搜集整理新浪微博禁发词,目前也以列表的形式添加到搜索禁词的公开表格中:历年禁词汇总

在推特关注、私信我们:@CDTChinese

陈光诚

测试时间:2011年10月22日

要有光,要有诚,东师古,冻尸骨村,东尸骨村,自由光诚,陈光诚


江泽民死亡传言

六四22周年

茉莉花

真理部

周永康