程序员们不能没有1024,就像西方不能没有耶路撒冷。这几年科技都喜欢在10月24日开发布会,解释起来也不复杂,说1024是组成4个十进制数字的最少二次方数,在电脑语言里有非凡意义。
当然,有些网站间隔1024秒才能再发帖的也可以算在内。
今天,科大讯飞创始人刘庆峰在体育场里发布了自己最新一代的星火大模型。据他说,星火3.0大模型中文能力客观评测超越ChatGPT,英文能力对标ChatGPT48项任务结果相当。所以:
综合能力已超ChatGPT。
刘总说话,乃悟一向是完全相信的。但毕竟他们曾经出过“讯飞听见”后面的真人同声传译员发文说我不是AI这种事。
所以乃悟试着问了ChatGPT和星火相同的几个问题,包括鸡兔同笼,旅行安排、名人简介、代码等。
这些问题都使用的是中文,前面三个问题乃悟没有比较出明显的优劣,到了最后一个代码问题的时候,ChatGPT大概用了10秒就给出了答案。星火则一连问了三次,也没吭声。
此前科大讯飞说星火2.0相比ChatGPT在代码功能上,差距只有1%。小半年过去了,2.0都变成3.0了,这1%的问题怎么还没解决?
对于乃悟的疑问,科大讯飞的朋友倒是有一番说法:
你不能用几个问题来评价大模型的好坏。
巧了,今天有一则新闻爆出,用户从另一方面评价了大模型。
有家长说在自家孩子的科大讯飞学习机中的《蔺相如》一文里,发现了一些诋毁伟人、扭曲历史等违背主流价值观的内容。
刘庆峰在百忙之中回应了这个问题,他说这是合作伙伴提供的内容,第一时间已经下架了,同时内部已经将用于大模型的内容审核机制放到了学习机上,以后的学习机内容审核会更加严格。当然,刘总还不忘说一句:
负面舆情有推手。
三令五申要减负大家就是不听,关键时刻还是要靠刘总搞搞新意思。这个消息一出,正在办喜事的科大讯飞股价直接跌停。媒体们就今天跌停分析了很多,甚至还把刘总8月份抛售4000万股自家股份,套现几十亿,获利75%的事情也说了一遍。
刘总说负面舆情有推手,你们在暗示什么?
负面舆情有没有推手乃悟不知道,但星火的对手乃悟还是了解一些的。
ChatGPT 3.0训练一次的成本是140万美元,而且随着参数样本量增加,成本也会增加。算上服务器等各方面投入,第一阶段就要砸8亿美元。
而GPT-4就更烧钱了,坊间传闻,一次训练的费用大概在6400万美元左右。
按道理说,科大讯飞的星火既然综合能力已经超过了ChatGPT,那投入应该也是相当大吧?乃悟翻了翻科大讯飞的财报,今年上半年,科大讯飞研发投入相比去年同期增加了:
人民币9000万。
而且科大讯飞全年研发投入也就20多个亿。那么问题的真相只能有两个,要么科大讯飞找到了花小钱办大事的路子,要么就是OpenAI内部有人搞贪污。
这边建议OpenAI的纪委赶紧介入查一查吧。