Chat with Wiki - 帮我总结现在主流的AI大模型，以及各自优劣

Answer

以下是对主流 AI 大模型的总结及各自优劣的相关内容：

主流 AI 大模型：

谷歌的 BERT 模型：可用于语义理解，如上下文理解、情感分析、文本分类等，但不太擅长文本生成。

相关技术概念：

AI：即人工智能。
机器学习：电脑通过找规律进行学习，包括监督学习、无监督学习、强化学习。
- 监督学习：使用有标签的训练数据，目标是学习输入和输出之间的映射关系，包括分类和回归。
- 无监督学习：学习的数据没有标签，算法自主发现规律，经典任务如聚类。
- 强化学习：从反馈中学习，以最大化奖励或最小化损失，类似训练小狗。
深度学习：参照人脑，具有神经网络和神经元，因层数多被称为深度。神经网络可用于监督学习、无监督学习、强化学习。
生成式 AI：能够生成文本、图片、音频、视频等内容形式。
LLM（大语言模型）：对于生成式 AI，生成图像的扩散模型不属于大语言模型。

技术里程碑：2017 年 6 月，谷歌团队发表论文《Attention is All You Need》，首次提出 Transformer 模型，其完全基于自注意力机制处理序列数据，无需依赖循环神经网络或卷积神经网络。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI学习笔记】小白如何理解技术原理与建立框架（通俗易懂内容推荐）

一、视频一主要回答了什么是AI大模型，原理是什么。1、概念：生成式AI生成的内容，叫做AIGC2、概念与关系：相关技术名词1）AI——人工智能2）机器学习——电脑找规律学习，包括监督学习、无监督学习、强化学习。3）监督学习——有标签的训练数据，算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4）无监督学习——学习的数据没有标签，算法自主发现规律。经典任务包括聚类，比如拿一堆新闻文章，让模型根据主题或内容特征分成具有相似特征的组。5）强化学习——从反馈里学习，最大化奖励或最小化损失；类似训小狗。6）深度学习——一种方法，参照人脑有神经网络和神经元（因为有很多层所以叫深度）。神经网络可以用于监督学习、无监督学习、强化学习。7）生成式AI——可以生成文本、图片、音频、视频等内容形式8）LLM——大语言模型。对于生成式AI，其中生成图像的扩散模型就不是大语言模型；对于大语言模型，生成只是其中一个处理任务，比如谷歌的BERT模型，可用于语义理解（不擅长文本生成），如上下文理解、情感分析、文本分类；3、技术里程碑——2017年6月，谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型，它完全基于自注意力机制（Self-Attention）来处理序列数据，而不需要依赖于循环神经网络（RNN）或卷积神经网络（CNN）。

【AI学习笔记】小白如何理解技术原理与建立框架（通俗易懂内容推荐）