CDT 档案卡
标题:【404文库】“也许五年后,在地球绝大部分地区,GPT取代了谷歌,但是大陆还在用百度”(外二篇)
来源:微信公众号“红博士说”、网易新闻、知乎
来源:中国数字时代
主题归类:ChatGPT CDS收藏:时间馆
版权说明:该作品版权归中国数字时代所有,欢迎个人、媒体和研究机构在注明来源的前提下免费使用。详细版权说明

《404档案馆》讲述中国审查与反审查的故事,同时以文字、音频和视频的形式发布。播客节目可在 Apple Podcasts, Google Podcasts, Spotify 或泛用型播客客户端搜索“404档案馆”进行收听,视频节目可在Youtube“中国数字时代· 404档案馆”频道收看。

欢迎来到404档案馆,在这里,我们一起穿越中国数字高墙。

尽管中国的言论审查和舆论管控日趋严峻,国家对公民的监控也无处不在,但我们依然可以看那些不服从的个体,顶着被删号、被约谈、甚至被监禁的风险,对不公义勇敢发出自己的声音。

中国数字时代在“404文库”栏目中长期收录这些被当局审查机制删除的声音。

本期节目,我们选读过去一周中引起舆论关注的三篇404文章。

一、红博士说|中国如何缺席CHATGPT盛宴

2022年11月,OpenAI开发的一个人工智能聊天机器人程序ChatGPT被推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。

2023年2月,ChatGPT开始在中国互联网上爆火。但早在2022年12月它推出之时,就引爆了全球互联网,发布两周之内用户即破亿,热度经久不衰。

2月2日,微信公众号“红博士说”发布文章《中国如何缺席CHATGPT盛宴》。

作者在文中梳理了ChatGPT的时间轴,ta写道:

2020年

年初,Covid-19爆发。中国闭关。

5月,GPT-3论文发布。

6月,GPT-3 API发布。

9月,ChatGPT的关键原型算法相关论文发布。

12月,欧洲机构发布用于GPT-3复现的开源数据集。

2021年

11月,GPT-3 API Public Release,不对中国开放。

中国闭关。

2022年

12月1日,ChatGPT发布。Musk等名流开始谈论ChatGPT,引爆英文互联网。

12月初,中国互联网的自媒体逐渐开始讨论ChatGPT,主要以翻译twitter的方式。知乎上有学者开始反思。一周后,关注指数下降,两个月来只剩下AI自媒体把ChatGPT作为自己的主要关注内容。

中国闭关。

2023年

1月,微软宣布投资OpenAI数十亿美元,并将GPT加入全家桶。

2月,中国春节结束,微软和Google你方唱罢我登场,纳斯达克财报季,AI被反复提起。中国互联网是认识微软的,ChatGPT引爆中国互联网,关注指数飙升。

中国开放。

值得注意的是,中国因为疫情闭关的三年,正是OpenAI的GPT发展、壮大、产品化的三年。

10年来,我们以为自己积攒的AI算法、数据、应用的优势,如今变成中美巨大的鸿沟。这个时候,我们甚至没有一个新闻调查,把这件事的来龙去脉,挖它个底朝天。

另一个问题是,我们的中文互联网不足以提供高质量的训练数据。什么是高质量的数据?比如维基百科、高质量的活跃论坛、专业新闻、学术论文、高质量代码、图书。

没有好的中文数据,我们就只能搭全球互联网的数据顺风车。上面这些优质数据的产生,需要开放的社区,我们似乎无解。

二、知乎网友|国内研究CHATGPT的主要阻碍是怕它乱说话

在知乎上,一名网友发起了提问“阻碍国内团队研究ChatGPT这样产品的障碍有哪些,技术,钱,还是领导力?”,评论区有一条回复遭到了删除。

ta写道:

主要阻碍是怕ChatGPT乱说话……大语言模型完全是黑箱,你不能保证他永远不说一些不兴说的东西,一旦说错话对任何一个公司都是毁灭性的打击。所以根本不会有团队去做,做出来了也不可能开放给普通人用。也许五年后,在地球绝大部分地区,GPT取代了谷歌,但是大陆还在用百度。

中国数字时代编辑同时摘录了一些其他用户的回复:

lili:首先得让AI具备识别一切敏感点的能力。不但得能识别过去和现在的。还得可以预测未来的,起码10后的。估计550W的算力不够,550WWWWWW也许成。

知乎用户:方向。这个东西一定会被拿来做审核机器人的,我碰到过好几个这样的团队了。绝对不可能拿来做大模型公开使用的,不然竞对直接恶意提问+举报,能把你搞到破产+吃捞饭。

顾尘:追求自由的环境吧,第一,学者有自由研究的习惯和空间,第二,非官方研究机构有空间做大做强,第三,有政策环境和法律保障保护参与贡献者包括个人和公司的合理回报。

羡鱼智能:最大的阻碍是眼界、风气。创新是有失败风险的,而跟风就稳妥多了,擅长后发制人。站在国外成果的肩膀上,搞个XX中文版,虽然不一定能吃上肉,但肯定能喝到汤,赢麻了!可惜,有些东西还真复刻不出来,这时候就会说,他们怎么不开源!

Out Man:一个问题+一个答案,也许一个产品就没了,有哪个资本敢投?就算你好不容易让这个产品苟活下来,也早已面目全非了,甚至很可能你花在人工筛选上的成本都超过研发投入了。

知乎用户:你如果,非要刨根问底,非要每一个事情的原因都说明白。那么我只能说,到最后,会发现是意识形态问题。这不是我的主观猜测,这是一个客观事实罢了,而且大部分人心里都清楚,就是嘴上要辩解。这也很正常,屁股决定脑袋。

巴拉丁:想平地起高楼,要先打好地基,地基都没得,你也就能起个三层小洋楼。

嘉心糖P用没有:我有一个想法,我们可以研究一个审核chatgpt说话的ai,我们不能随便说,但是我们可以随便不说!审核AI-chineseGPT,项目立项了之后,其实只需要加一个敏感词库,经费来!

三、网易新闻|官媒尴尬了,为什么越来越多的人都不相信勤劳能致富了?

2月9日,人民网发布了一篇名为《好好干,日子会越来越甜》的文章,试图传播“正能量”。然而,这篇文章却引发了网友热议,越来越多的人不相信勤劳能够致富。

2月14日,在网易自媒体平台“网易号”上,一篇名为《官媒尴尬了,为什么越来越多的人都不相信勤劳能致富了?》被发布。

文中写道:

按道理说,中国经历了3年疫情,在这3年里,人们的生活过得非常的苦,很多人因为疫情失去了工作,失业在家,还不起房贷和车贷,所以很多人经济发生了一些翻天覆地的变化。

以前有疫情,赚不到钱可以怪疫情,现在疫情放开了,没有理由没钱了,再没钱就说不过去了。再没钱就是你不努力了。

所以人民网的作者才想到写这么一篇小短文来鼓励大家吧,小短文是真的很甜啊,但是甜甜的小短文没有获得老百姓的一致好评,反而还受到了越来越多的嘲讽,为啥为啥呢?

我就拿我身边的人来举例子吧,从我身边的人身上我看到了,其实努力干,真的赚不到钱。

我老公有一段时间晚上去送外卖,一单才挣5块钱,从晚上八点跑到晚上12点才赚了三十几块钱,一个月才赚了800块钱,这800块钱能干啥啊?

关键是送外卖很辛苦啊,刮风下雨天气那么冷,雨水打到脸上多难受,衣服都淋湿,爬楼梯,这么辛苦,一天才赚30块钱,好点的情况下赚50块。

冬天冷的要命,夏天热的要命。

你说他不吃苦吗?他也吃苦了,但是收益很小啊,和付出的劳动不成正比。

但是你看某些人,一杯茶,一份报纸,日上三竿才到单位,到单位报个道,坐那里喝喝茶,醒醒酒,中午出去陪情人约会,晚上高档娱乐场所玩一玩,人家一年赚的钱都比我们一辈子赚的都多,人家贪污的钱,比我们后代几辈人赚的都多,这样的日子多么潇洒?快乐似神仙。

以上是本期选读的三篇404文章。这些作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。

中国数字时代 CDT 致力于记录和传播中文互联网上被审查的信息,以及人们与审查对抗的努力。欢迎大家通过电报(Telegram)平台 向我们投稿,为记录和对抗中国网络审查作出你的贡献!

cdtimg

了解更多投稿信息,请阅读中国数字时代征稿说明

欢迎读者访问 CDT播客CDT视频 收听/观看更多相关内容。