Chat with Wiki - 数据解读类的AI大模型

Answer

以下是关于数据解读类的 AI 大模型的相关知识：

大模型的整体架构可以分为以下几层：

基础层：为大模型提供硬件支撑和数据支持，例如 A100、数据服务器等。
数据层：这里的数据层不是用于基层模型训练的数据基集，而是企业根据自身特性维护的垂域数据，分为静态的知识库和动态的三方数据集。
模型层：包括 LLm（大语言模型，例如 GPT，一般使用 transformer 算法来实现）或多模态模型（如市面上的文生图、图生图等的模型，训练所用的数据与 llm 不同，用的是图文或声音等多模态的数据集）。
平台层：模型与应用间的平台部分，比如大模型的评测体系，或者 langchain 平台等，提供模型与应用间的组成部分。
表现层：也就是应用层，是用户实际看到的地方。

相关技术名词及概念：

生成式 AI 生成的内容叫做 AIGC。
AI 即人工智能。
机器学习是电脑找规律学习，包括监督学习、无监督学习、强化学习。
- 监督学习：有标签的训练数据，算法的目标是学习输入和输出之间的映射关系，包括分类和回归。
- 无监督学习：学习的数据没有标签，算法自主发现规律，经典任务包括聚类。
- 强化学习：从反馈里学习，最大化奖励或最小化损失，类似训小狗。
深度学习是一种参照人脑有神经网络和神经元（因有很多层所以叫深度）的方法，神经网络可以用于监督学习、无监督学习、强化学习。
生成式 AI 可以生成文本、图片、音频、视频等内容形式。
LLM 是大语言模型，对于生成式 AI，其中生成图像的扩散模型就不是大语言模型；对于大语言模型，生成只是其中一个处理任务，比如谷歌的 BERT 模型，可用于语义理解（不擅长文本生成），如上下文理解、情感分析、文本分类。

技术里程碑：2017 年 6 月，谷歌团队发表论文《Attention is All You Need》，首次提出了 Transformer 模型，它完全基于自注意力机制（Self-Attention）来处理序列数据，而不需要依赖于循环神经网络（RNN）或卷积神经网络（CNN），Transformer 比 RNN 更适合处理文本的长距离依赖性。

Content generated by AI large model, please carefully verify (powered by aily)

References

Ranger：【AI 大模型】非技术背景，一文读懂大模型（长文）

首先为方便大家对大模型有一个整体的认知，我们先从大模型的整体架构着手，来看看大模型的组成是怎么样的。下面是我大致分的个层。从整体分层的角度来看，目前大模型整体架构可以分为以下几层：[heading3]1.基础层：为大模型提供硬件支撑，数据支持等[content]例如A100、数据服务器等等。[heading3]2.数据层[content]这里的数据层指的不是用于基层模型训练的数据基集，而是企业根据自己的特性，维护的垂域数据。分为静态的知识库，和动态的三方数据集[heading3]3.模型层：LLm或多模态模型[content]LLm这个大家应该都知道，large-language-model，也就是大语言模型，例如GPT，一般使用transformer算法来实现。多模态模型即市面上的文生图、图生图等的模型，训练所用的数据与llm不同，用的是图文或声音等多模态的数据集[heading3]4.平台层：模型与应用间的平台部分[content]比如大模型的评测体系，或者langchain平台等，提供模型与应用间的组成部分[heading3]5.表现层：也就是应用层，用户实际看到的地方[content]这个就很好理解了，就不用我多作解释了吧

【AI学习笔记】小白如何理解技术原理与建立框架（通俗易懂内容推荐）

一、视频一主要回答了什么是AI大模型，原理是什么。1、概念：生成式AI生成的内容，叫做AIGC2、概念与关系：相关技术名词1）AI——人工智能2）机器学习——电脑找规律学习，包括监督学习、无监督学习、强化学习。3）监督学习——有标签的训练数据，算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4）无监督学习——学习的数据没有标签，算法自主发现规律。经典任务包括聚类，比如拿一堆新闻文章，让模型根据主题或内容特征分成具有相似特征的组。5）强化学习——从反馈里学习，最大化奖励或最小化损失；类似训小狗。6）深度学习——一种方法，参照人脑有神经网络和神经元（因为有很多层所以叫深度）。神经网络可以用于监督学习、无监督学习、强化学习。7）生成式AI——可以生成文本、图片、音频、视频等内容形式8）LLM——大语言模型。对于生成式AI，其中生成图像的扩散模型就不是大语言模型；对于大语言模型，生成只是其中一个处理任务，比如谷歌的BERT模型，可用于语义理解（不擅长文本生成），如上下文理解、情感分析、文本分类；3、技术里程碑——2017年6月，谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型，它完全基于自注意力机制（Self-Attention）来处理序列数据，而不需要依赖于循环神经网络（RNN）或卷积神经网络（CNN）。GPT含义：Transformer是关键。Transformer比RNN更适合处理文本的长距离依赖性。

【AI学习笔记】小白如何理解技术原理与建立框架（通俗易懂内容推荐）