秒懂:图解人工智能训练及工作过程(中文流程图)

人工智能
后台-插件-广告管理-内容页头部广告(手机)

为了方便大家从整体了解人工智能训练的过程,避免因为过多的概念影响对整体的理解,我们绘制了这张流程图。

人工智能训练过程图

  1. 数据收集:收集用于训练的数据,输出原始数据(未经处理的数据集)
  2. 数据预处理:清洗和格式化数据,输出预处理数据(适合模型训练的数据)
  3. 模型初始化:设定模型的初始参数,输出初始化模型(设定初始参数的模型)
  4. 模型训练:使用数据训练模型,输出训练模型(经过一轮训练的模型)
  5. 模型评估:评估模型的性能,输出评估结果(模型的性能指标)
  6. 模型优化:根据评估结果优化模型,输出优化模型(经过优化的模型)
  7. 模型部署:将模型应用于实际环境,输出最终模型(满足要求的模型)

下图是ChatGPT的工作流程简图:

ChatGPT工作流程简图

一、用户输入:用户提供的原始输入。

二、输入处理:处理用户的输入,准备送入模型。

  1. 分词器:将输入的文本分解为可以被模型理解的小块(token)。
  2. Tokenization:将输入的文本转换为token的过程。

三、ChatGPT模型:接收处理后的输入,开始生成回复。

  1. Transformer模型:ChatGPT模型的核心部分,用于理解输入和生成回复。
  2. 自注意力机制:Transformer模型的关键部分,用于理解输入中的各个部分之间的关系。
  3. 多头注意力:自注意力机制的一部分,允许模型同时关注输入的多个部分。
  4. 缩放点积注意力:多头注意力的一部分,计算输入部分之间的关系。
  5. 生成回复:根据理解的输入和学习到的模式,生成回复。

四、输出处理:处理模型生成的输出,准备展示给用户。

  1. 反分词器:将模型生成的token重新组合成人类可读的文本。
  2. Detokenization:将token转换回文本的过程。

五、用户看到回复:用户看到最终的回复。

Token样例

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。