这套“蒙藏维哈朝民族文字文档综合识别理解系统”,系由丁晓青教授主持,由清华大学、内蒙古大学、内蒙古师范大学、西北民族大学、新疆大学等单位共同合作完成,是世界首创在统一平台上支持中国主要少数民族文字文档的识别系统。

据报道,这套系统已用在新疆及西藏地区,因为当地的国家安全人员大多都不懂当地的语言,然而人权组织却担心,这套新科技将协助当局更方便地打压少数民族。

丁晓青教授说,有了这一科技手段的帮助,当局可以即时第一手取得情报资讯,他们只需利用一个系统,就可以解读多种少数民族的语言。她说,这套系统可以辨识解读中国国内所有主要的少数民族语言。据了解,这个系统还适用于中国以外的语言,例如阿拉伯语和日语。

丁晓青以10月28日天安门广场汽车袭击一事为例说,类似她所研发的系统,将更有效地搜集之前所难以洞测的情报。在该次事件中,有5人死亡,38人受伤。北京将事件归咎于新疆分离分子。

丁晓青称,一个更好功能的系统,可以洞悉危险的讯号,特别是针对那些以图像隐藏的信息,及早化解事发的可能性。

她说,越来越多信息,透过图像在互联网上发放,企图逃避政府的监控,目前已知的仪器,都难以监察这些信息。

南华早报引述自由西藏组织主任Eleanor Byrne-Rosengren说,这套系统早已派上用场,目前正监察互联网上有关西藏的信息发放,“今年年初,当局在一次偶尔的监察下,发现一个西藏少年的电话里面因为录了一些西藏歌曲而被逮捕”。Byrne-Rosengren又说:“我们也知道有些西藏人被捕,他们主要是被查询有关一些图像里面所隐藏的信息,暗示当局的监察促使警方采取行动。”

丁晓青教授主持的“智能图文信息处理研究室”隶属于清华大学电子工程系,也是清华信息科学与技术国家实验室的一部分。自上世纪80年代开始,主要从事智能图文信息处理,特别是文字和图像的识别理解研究,致力于赋予计算机视觉感知功能。

本文由自动聚合程序取自网络,内容和观点不代表数字时代立场

墙外新闻实时更新 欢迎订阅数字时代