Chat with Wiki - 我是一个没有技术背景且对AI感兴趣的互联网产品经理，目标是希望理解AI的实现原理并且能够跟开发算法工程师沟通交流，请给我举出AI模型或者机器学习的分类吧。

Answer

以下是 AI 模型和机器学习的分类：

AI（人工智能）：是一个广泛的概念，旨在使计算机系统能够模拟人类智能。
机器学习：是人工智能的一个子领域，让计算机通过数据学习来提高性能。包括以下几种类型：
- 监督学习：使用有标签的训练数据，算法学习输入和输出之间的映射关系，包括分类和回归任务。
- 无监督学习：学习的数据没有标签，算法自主发现规律，经典任务如聚类。
- 强化学习：从反馈中学习，以最大化奖励或最小化损失，类似训练小狗。
深度学习：是机器学习的一个子领域，模拟人脑创建人工神经网络处理数据，包含多个处理层，在图像识别、语音识别和自然语言处理等任务中表现出色。
大语言模型：是深度学习在自然语言处理领域的应用，目标是理解和生成人类语言，如 ChatGPT、文心一言等。同时具有生成式 AI 的特点，能够生成文本、图像、音频和视频等内容。

2017 年 6 月，谷歌团队发表论文《Attention is All You Need》，首次提出了 Transformer 模型，它基于自注意力机制处理序列数据，不依赖循环神经网络或卷积神经网络。生成式 AI 生成的内容称为 AIGC。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI学习笔记】小白如何理解技术原理与建立框架（通俗易懂内容推荐）

一、视频一主要回答了什么是AI大模型，原理是什么。1、概念：生成式AI生成的内容，叫做AIGC2、概念与关系：相关技术名词1）AI——人工智能2）机器学习——电脑找规律学习，包括监督学习、无监督学习、强化学习。3）监督学习——有标签的训练数据，算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4）无监督学习——学习的数据没有标签，算法自主发现规律。经典任务包括聚类，比如拿一堆新闻文章，让模型根据主题或内容特征分成具有相似特征的组。5）强化学习——从反馈里学习，最大化奖励或最小化损失；类似训小狗。6）深度学习——一种方法，参照人脑有神经网络和神经元（因为有很多层所以叫深度）。神经网络可以用于监督学习、无监督学习、强化学习。7）生成式AI——可以生成文本、图片、音频、视频等内容形式8）LLM——大语言模型。对于生成式AI，其中生成图像的扩散模型就不是大语言模型；对于大语言模型，生成只是其中一个处理任务，比如谷歌的BERT模型，可用于语义理解（不擅长文本生成），如上下文理解、情感分析、文本分类；3、技术里程碑——2017年6月，谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型，它完全基于自注意力机制（Self-Attention）来处理序列数据，而不需要依赖于循环神经网络（RNN）或卷积神经网络（CNN）。

【AI学习笔记】小白如何理解技术原理与建立框架（通俗易懂内容推荐）

融合RL与LLM思想，探寻世界模型以迈向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」

LLM大家都已经再熟知不过了，为了承上启下，这里针对LLM再做一些简单的概念以及自认为一些关键内涵的回顾。从概念分类角度上看，大语言模型是深度学习的分支。其中：机器学习是人工智能（AI）的一个子领域，它的核心是让计算机系统能够通过对数据的学习来提高性能。在机器学习中，我们不是直接编程告诉计算机如何完成任务，而是提供大量的数据，让机器通过数据找出隐藏的模式或规律，然后用这些规律来预测新的、未知的数据。深度学习是机器学习的一个子领域，它尝试模拟人脑的工作方式，创建所谓的人工神经网络来处理数据。这些神经网络包含多个处理层，因此被称为“深度”学习。深度学习模型能够学习和表示大量复杂的模式，这使它们在诸如图像识别、语音识别和自然语言处理等任务中非常有效。大语言模型是深度学习的应用之一，尤其在自然语言处理（NLP）领域。这些模型的目标是理解和生成人类语言。为了实现这个目标，模型需要在大量文本数据上进行训练，以学习语言的各种模式和结构。如ChatGPT，文心一言，就是一个大语言模型的例子。被训练来理解和生成人类语言，以便进行有效的对话和解答各种问题。如下图所示中LLM与ML、DL的关系：同时，LLM还有一个可以说独有的特点，即生成式AI，这也是区别与其它传统模型或训练任务的Uniqueness，表面上看，这种技术包括用于生成文本、图像、音频和视频等各种类型的内容的模型，其关键特性是，它不仅可以理解和分析数据，还可以创造新的、独特的输出，这些输出是从学习的数据模式中派生出来的。