ChatGPT的前世今生-花粉乐享

> 乐学堂 > > ChatGPT的前世今生

ChatGPT的前世今生

来源：腾讯技术工程

2023-05-17 15:12:59

294

管理

作者：lewisywliu，腾讯PCG客户端开发工程师

ChatGPT是什么

首先从全称看，Chat Generative Pre-trained Transformer，分为两部分。前部分为chat，聊天，ChatGPT是从聊天切入人们的生活，从聊天开始，但是又不止于聊天。后半部分是使用到的相关模型与架构。

G是生成式，P是预训练模型，T是Transformer架构。

其中的生成式，与之对应的还有判别式，像人脸识别之类的都属于判别式。生成式，表示了模型是生成、预测数据的，而ChatGPT是，根据前文单词来预测生成当前的单词，最终生成整个回答。

这里也问了一下ChatGPT，从回复中可以看出，ChatGPT就是一个聊天机器人，但是他比其他的机器人更加的智能，知道的东西更多。

ChatGPT发展历程

ChatGPT一开始是基于GPT3.5的，现在最新的是基于GPT4。那GPT是怎么发展过来的呢，那就要从很久以前说起。

前世2003年Bengio提出NNLM

谷歌对NNLM改进，提出RNNLM，用内部隐藏状态，解决长距离依赖问题，目标是使用所有上文信息来预测下一个单词。

2013年谷歌提出Word2Vec

单词到向量，将上文提到的词嵌入发扬光大。从此开始，自然语言学习不在专注于建模语言模型，而是用语言模型学习单词的语义化向量。

首先GPT使用到的是预训练模型，预训练模型主要分为两段训练，先在大规模未标注语料库预先训练一个初始模型，这第一步就是无监督学习。然后再利用有标注数据对模型进行精调，第二步就是有监督学习并进行微调。这里就是GPT中的P。

在此之前，大部分语言模型是使用有监督学习，一个是需要大量有标注的数据，金钱、时间成本都非常高。另一个是训练的模型很难泛化到其他任务中，只能说是特定领域的专家。

GPT-1，放到未经微调的任务上，也会有一些效果，但远低于经过微调的有监督任务。也就是有一定的泛化能力，有很大的提升空间。

GPT-1可以说是跑通了大模型的训练范式，在这之后的大模型基本都是预训练的模式。

2019年，openAI推出GPT-2，使用无监督的预训练模型做有监督的任务

图中是GPT2在4个未经微调的任务执行的效果，折线为GPT2，虚线为对比的模型。可以看出，在模型足够大的时候，在某些任务下的效果已经超过了，有监督学习的模型。当然还是有些任务效果是比较差的，但总体是上涨的趋势，所以只要模型再大点，效果就会超过大部分的模型。

GPT-2在整体架构上并没有做太大的改动，主要是验证：当模型的容量非常大且数据量足够丰富时，仅仅靠训练语言模型的学习便可以完成其他有监督学习的任务。

2020年，openAI推出GPT-3，超大的模型

从这个版本开始，GPT不在开源，openAI从此变成了closeAI。在GPT-2的基础上，openAI开始海量的堆数据，我们可以看看这个图，到GPT-3的时候，参数量和预训练数据量有了超百倍的提升。豪赌1200万美金，也可以说是大力出奇迹，效果确实很好。

这是最终得到的准确性效果，可以看出在模型参数增大的情况下，准确性都会提高，并且给较多的提示，准确性会提升的的更多。这里的相当于在和GPT-3聊天的过程中，GPT-3能够理解上下文，根据上下文更好的完成当前的任务。

到这里GPT-3已经学习了很多很多内容，但是内容中有好有坏的，或者说会被内容带偏，例如种族歧视、性别歧视。所以这里直接商用的话，还是存在了一些问题。

今生GPT3 RLHF ≈ GPT3.5 ≈ ChatGPT

openAI对GPT-3进行微调，衍生出GPT-3.5，3.5之所以叫3.5，是因为是基于GPT3，做了特定领域的微调后，衍生出新的模型。

例如Codex 用作代码生成，instructGPT是ChatGPT的兄弟模型，经过RLHF(基于人类反馈的强化学习)微调得来的。

目前的话，我暂时没有看到官方针对ChatGPT的论文和技术说明，不过官方的文档是这么写的。一个是 ChatGPT是instructGPT的兄弟模型。第二个是ChatGPT从GPT3.5的一个模型微调过来的从官方的说明上可以看出，InstructGPT约等于ChatGPT，ChatGPT可以说是针对聊天场景的更高级版本。

这里还是去问了一下TChatGPT，上面是GPT3.5的回复，可以发现红线的回答是有问题的，都是乱讲的。

这个是GPT4的，回答上，算是合理，有理有据。（这里也试了鲁迅打了周树人的问题，GPT3.5确实有问题，而且怎么都无法纠正，GPT4中回复是正确的）

缺点：

准确性：对于ChatGPT来说，学了很多，但目前还不能保证所有内容都是正向或正确的。有时候会给出看似合理，但是错误的答案，此时往往就会误导用户，造成负面影响。这也是大家所说的幻觉问题安全性：前段时间也很多人在怀疑ChatGPT的安全性问题，虽然官方说是安全的，但是这里我还是要打上问号，所以大家在使用的时候一定要注意个人信息、机密信息的泄露缺乏情感、个性化：就像那谁说的，ai只有芯，而人有心。

抛开这些来说，ChatGPT确实迈出了一大步，这一大步可以说是意料之中，也可以说意料之外。因为这一天终会到来，只是没想到突然被加速了。

突然又有一个问题

本来我以为GPT4完善的很好了，但是在我收集各大语言模型的数据时，GPT4又开始忽悠我了。

Transformer中为512（d_model）

花粉社群VIP加油站

3

赏礼

赏钱

0

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com

谷歌全面反攻 ChatGPT！PaLM 2、Gemini 双杀，Bard 正式开放

2023-05-17 15:16

多国要调查ChatGPT，TA碰了什么红线？

2023-05-17 15:10