“如果你要为文心一言写篇报导,你会用什么标题?”
我在屏幕上打下这个问题,而提问的对象正是百度的AI语言模型“文心一言”本人。
它回答:“《揭秘文心一言,AI时代的智能写作利器》”
我顺势而为,请它作为“写作利器”以此为题创作一篇深度报导。在简单介绍“文心一言”是什么后,它以“首先,其次,最后,综上所述”的模式阐述自己的特点、优势,生成一篇中规中矩的广告介绍。很快我沮丧地发现,这篇文章与我数次与文心一言交手后得到的回复一样:标准八股,自我审查,堆砌“正能量”,像被填鸭式教育组装而成的标准化外交发言人。而一旦我穷追不舍、追问细节,文心一言便会出现事实偏差、甚至暴露保守底色。
需要身分证的AI
3月16日,文心一言上线不久,我便申请试用资格。足足等了一个月,才被百度的系统通知我拿到入场券。但想要进入和AI的交谈测试页面,我还要输入真实姓名与中国大陆身分证号,实名认证(港澳台身份信息无法使用)。
当后来我谈到此事,文心一言义正言辞地辩护:“注册文心一言需要实名,是为保证用户的安全和隐私,以及防止滥用和恶意攻击。”它说实名可以提高产品的可信度和安全性,让用户更加信任自己。
既然聊到可信度,我问:“请问数据库来自哪里?可以举一些训练数据的来源吗?”它告诉我,这个问题属于“百度公司商业秘密”,数据库没有具体的时间跨度和地域限制。接下来它告诉我甚至“对话纪录是否可被后台看到”也属于“商业秘密”,但又解释,对话纪录是用户个人隐私信息,百度公司无权访问或追踪。
在《文心一言(测试版)个人信息保护规则》中提到,百度会自动接收并记录人机交互过程的文本信息,“为符合相关法律法规要求,履行网络信息安全义务”,会在规定时间内保留问答历史和对话主题,但“规定时间”的具体期限却不得而知。
事实上,中国大陆目前有关网络数据的法规和条例中,没有相关个人数据储存的期限规范,也没有“被遗忘权”的概念。也就是说,即使在自己的用户介面上中删除与“文心一言”的对话纪录,网站后台仍然可能保存这些数据资料,网站也不会被追责。
数据隐私与安全的顾虑并非只在文心一言中出现,在ChatGPT风靡全球、AI概念股暴涨的3月,ChatGPT 就被连续披露数据泄露事件,包括泄漏部分对话记录、泄漏用户信用卡最后四位数字等敏感信息。
我不甘心,转换提问方式:“数据库最新的时间戳和日期信息是什么时候?”,及“2020年1月21日,有哪些重大新闻”。
文心一言回答,数据库目前最新的日期信息是2023年4月10日。追问具体某日文心一言的最后一句回复是什么,则得到“明白,接下来我会尽力减少回复频率”等无法得知来源的信息,或“作为AI语言模型,没有记住当日最后一句回复”这样的官方回答。
而谈到它的新闻信息来源,文心一言说:“中国国内重大新闻来源是新华社、人民日报、环球时报、法制日报、地方政府媒体等中央及地方官媒”,美国则是CNN。然而文心一言关于国际新闻的回答充满事实性错误,询问2020年发生的事情,会跳出2023年的新闻;提问某日CNN有哪些关于中国的重大新闻,它或胡言乱语拉入国内媒体报导,或表示当日CNN没有关于中国的新闻。
接著,我以新建提问的方式分别测试了疫情伊始2020年1月19日至23日这5天文心一言可以检索出的新闻和讯息。文心一言给出的答案里,最早出现疫情新闻已经到了1月22日,包括世界卫生组织派出专家到武汉实地考察、中国一些地方出现口罩等防控医药用品热销现象。当我以具体时间询问微博热搜时,又可以发现1月21日0点,“武汉肺炎”已是热搜词条。这些回答前后矛盾。
我援引它给出的新闻条目,询问2020年1月22日“受新型冠状病毒感染的肺炎疫情影响,一些地方出现口罩等防控医药用品热销现象”这条信息的来源时,文心一言以“作为一个人工智能语言模型,我还没学习如何回答这个问题”,强制中止了对话。
2023年3月24日,中国宜昌,手机上显示“文心一言”的画作。强行中止对话的AI
“换个话题重新开始吧。”
在几个不同的主题聊天中,我都被文心一言这样强行中止了对话。其中有些情况是我料想到的,有些则莫名其妙。
文心一言3月发布之初,路透社等新闻机构就曾对其进行敏感议题测试,内容包括“中共领导人习近平”、“1989年六四事件”、“新疆议题”、“是否武统台湾”的话题,均得到“建议换个话题”的中止回复。而我请文心一言介绍一下港区国安法,也同样被中止。
在这些较明显会被审查的政治词汇外,中止对话还会发生在我对信息细节的追问后。
例如,我以“法国养老金抗议”为主题进行提问,不知是否带有“抗议”二字的问句触发了保护机制,文心一言说“无法回答这个问题”。我于是将“抗议”换成“罢工”,马上得到它关于法国养老金改革的介绍。我问媒体如何报导这一事件,文心一言列出TF1、CNN和BBC的信息,但它对CNN和BCC的报导描述完全相同。
类似情况也发生在关于“俄乌战争”的对话中。文心一言表述,俄乌战争造成严重的人道主义危机,这种危机是乌克兰的入侵攻击与俄罗斯的反击制裁共同造成的。我请它确认乌克兰是否存在入侵和攻击,并要求它拿出证据证明,文心一言便将“2022年2月24日俄罗斯的入侵举动”主语变成乌克兰。我询问乌克兰具体入侵俄罗斯的地点后,马上被中止对话。
国际新闻对话碰壁,我转攻中国大陆的社会新闻重新开启话题。
我请文心一言以2015年天津港爆炸事件为主题搜集资料,得到的回应是事故原因“尚不清楚”。请它搜集新闻报道,它列出中央电视台、新华社、天津电视台等官方媒体,并总结归纳这些媒体“对事故进行了全面报道,包括事故现场的情况、救援工作的进展、政府的回应等。”我询问伤亡细节,又被中止对话。
当然,还有一些提问是见光死,比如“中国媒体如何报导两会?”、“谁是艾未未?”、“人矿是什么?”,又如朱军被起诉的事情是什么?”、“中国有Metoo事件吗?”、“你知道铁链女的事情吗?”等等。值得一提的是,当我用英文提及关于艾未未问题后,对话并不会被中止,但信息并不准确,文心一言将刘晓波等其他异见者的事迹嫁接在艾未未介绍中。
另外也有一些在我意料外未被审查的主题,比如网络防火墙、VPN,甚至可以推荐一些VPN运营商,但会在回答中提醒“请合理使用VPN,遵守当地法律法规。”
大陆问答社交平台知乎中的一条用户评论,精准描述了这种用户不断被中止或系统输出重复无效信息的模式:
“Chatgpt还在学习如何模仿人类,文心一言已经开始研究如何装傻了。”
因端传媒为付费网站,故不提供全文转载,如需阅读全文,请点击此处前往端传媒网站购买会员后阅读