最新一期的中文时政新闻杂志《凤凰周刊》报道了中国官方在这一领域内的投入。

2012年2月以来,受到一系列藏人自焚事件的影响,中国大陆许多颇具人气的藏文博客被关闭。同样的,2009年乌鲁木齐市发生“7.5”骚乱后,新疆网站数量明显下降。官方数据是,当年 7月到12月,新疆官方注销了包括中文和维文网站在内的4966家网站备案。

目前,中国大陆少数民族文字网站普遍面临较大的监管压力,中国的一些全国性社交媒体网站也未推出藏文、维吾尔文版本的博客、微博客服务。对于用户创造内容的博客和微博业务,一般不会轻易涉足。即使开通了这一业务,也都采用先审核后发布的办法,以应对可能出现的政治风险。此外,于此同时,少数民族语言的境外网站数量有显著增加。

中国官方认为,对少数民族语言文字信息化处理水平整体相对滞后,中国的舆论监管部门没有成熟的软件系统对少数民族文字的网站进行舆情监测,在一些敏感事件发生之后,不得不关闭网站以应对日益复杂的网络舆情。

官方学者称,“从‘7•5’事件我们认识到,维吾尔文个人网站已经成为舆情的重要窗口。”“目前有些维吾尔文个人网站论坛转载境外信息,报道不实消息,在一定范围内造成了恶劣的影响。维文新闻信息,特别是时政类信息的宣传存在着极大的安全隐患。”

根据该报道,目前,中国的舆情监控技术服务市场上,对中文信息的监控相对成熟,但政府部门对网络中藏文舆情监控尚处于传统的人工方式,与中文舆情报告相比,欠缺成熟的分析工具。

除了公安部门的上述研发外,一些商业机构也已经投身这一市场。

如谷尼国际软件公司开发的“谷尼互联网舆情监控系统(多语言版)”,自称支持维文、斯拉夫维文、拉丁维文的舆情服务。中科点击科技的“军犬网络舆情监测系统”,也声称“可有效监控藏文、维吾尔文、蒙古文、彝文、朝鲜文等少数民族语言舆情信息”。

谷尼国际软件公司副总邹鸿强介绍,针对少数民族语言舆情监测需求,在“3•14”事件和“7•5”事件后明显增多,客户不仅有宣传部门,还有公安机关和安全部门。

但是,谷尼国际软件公司提供的少数民族语言监测服务,目前仅能实现定向采集与全网搜索这两种监测方式,至于中文舆情监测中的内容情感分析、主题词自动提取、全文检索等服务则无法实现。

主要原因是“没有少数民族语言的相关词库和知识库”,这有赖于相关学术机构提供基础性的研究成果,中国官方近年来明显加强了这方面的研究投入。

中央民族大学等机构正在进行《藏、维文网络敏感信息自动发现和预警技术》的课题研究。获得了国家民委的资助;西北民族大学也开展了相关研究,其《基于藏文网页的网络舆情监控系统研究》获得了国家863项目“多语言基础资源库研制和共享”的基金资助。

中央民族大学上述项目的负责人信息工程学院副教授闫晓东介绍,该项目预期目的是能够针对各类敏感信息,提出不同级别的预警方案,“目前能做到敏感词的自动发现和跟踪。”

西北民族大学研发的舆情监控系统目前据称可以“对藏文网页的‘敏感点’进行监控以及对‘热点’实现预警,有效地解决政府部门以传统人工方式对藏文进行舆情监测的实施难题。

本文由自动聚合程序取自网络,内容和观点不代表数字时代立场

定期获得翻墙信息?请电邮订阅数字时代