ChatGPT
来自China Digital Space
ChatGPT,全称聊天生成预训练转换器(英語:Chat Generative Pre-trained Transformer),是OpenAI开发的人工智能聊天机器人程序,于2022年12月推出。该程序使用基于GPT-3.5、GPT-4、GPT-4o架构的大型语言模型並以强化学习训练。ChatGPT目前仍以文字方式互動,而除了可以用人類自然對話方式來互動,還可以用于甚為複雜的語言工作,包括自动生成文本、自动问答、自动摘要等多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本(劇本、歌曲、企劃等),在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。(维基百科:ChatGPT)
ChatGPT编年史
科技博主“红博士”在文章《红博士说|中国如何缺席ChatGPT盛宴》[1]中,梳理出了ChatGPT发展的时间轴。并且总结道:“中国因为疫情闭关的三年,正是OpenAI的GPT发展、壮大、产品化的三年。”
“ChatGPT是对话式UI + GPT–3.5系列模型,我们以最具代表性的论文、模型、API为主线,梳理到今天。”
2020之前
- 2017年6月,Google发布Transformer论文。
- 2017年6月,7月,OpenAI发布人类喜好的强化学习算法、PPO算法,都是ChatGPT用到的算法。
- 2018年6月,OpenAI发布GPT-1.
- 2018年11月,Google发布BERT,此后NLP领域主要基于这个框架研究下游任务。
- 2019年2月,OpenAI发布GPT-2,OpenAI获得了自信,此后专注于GPT.
2020年
- 年初,Covid-19爆发。中国闭关。
- 1月,OpenAI发布语言模型的Scaling Law(概念:模型能力跟参数规模、数据规模强相关),OpenAI获得了在数据和参数规模上Scaling-up的信心。
- 5月,GPT-3论文发布。
- 6月,GPT-3 API发布。
- 9月,ChatGPT的关键原型算法相关论文发布。
- 12月,欧洲机构发布用于GPT-3复现的开源数据集。
2021年
- 7月,OpenAI发布Copilot原型算法。
- 8月,Codex API发布。
- 11月,GPT-3 API Public Release,不对中国开放。
- 中国闭关。
2022年
- 1月,GPT-3.5 API (text-davinci-002)发布,该模型经过Github代码的训练加持,推理能力显著提升(该假设的因果关系待学术界论证),经过Alignment技术的加持,Follow人类指令的能力显著提升,输出结果有用性和无害性显著提升。
- 3月,GPT-3.5论文发布,公开Alignment算法。
- 5月,OpenAI Codex已经被70个应用使用,包括微软收购的Github的Copilot.
- 8月,Stability AI开源StableDiffusion,文生图的算法的效果可用、速度可行、代码开源同时发生,引爆图片生成。一时间,在中国,AIGC似乎就是图片生成的代名词。
- 9月,Sequoia Capital发布Generative AI: A Creative New World博客。
- 中国研究人员和开发者,没有OpenAI的API权限。但图片生成却人人都可以尝试,于是互联网似乎只注意到了图片生成,对GPT大语言模型的关注度进一步下降。
- 经过接近一年的API接入和UI探索、近一年的思维链(Chain of Thought)等Prompt Engineering技术试错、模型加速等技术(如Flash Attention、Fixed-Point)带来的成本和延迟下降,GPT-3.5的模型潜力得到开发(变得Better、Faster and Cheaper), Copy.ai, Jasper等文本生成类公司的产品逐渐成熟。
- 11月,OpenAI发布GPT3.5 API的新模型(text-davinci-003).
- 12月1日,ChatGPT发布。Musk等名流开始谈论ChatGPT,引爆英文互联网。
- 12月初,中国互联网的自媒体逐渐开始讨论ChatGPT,主要以翻译twitter的方式。知乎上有学者开始反思。一周后,关注指数下降,两个月来只剩下AI自媒体把ChatGPT作为自己的主要关注内容。
- 中国闭关。
2023年
- 1月,微软宣布投资OpenAI数十亿美元,并将GPT加入全家桶。
- 2月,中国春节结束,微软和Google你方唱罢我登场,纳斯达克财报季,AI被反复提起。中国互联网是认识微软的,ChatGPT引爆中国互联网,关注指数飙升。
- 中国开放。
值得注意的是,中国因为疫情闭关的三年,正是OpenAI的GPT发展、壮大、产品化的三年。