Chat with Wiki - 优秀的来源大模型有哪些

Answer

以下是一些优秀的大模型：

Google 的 T5：属于 encoder-decoder 类型的模型，适用于翻译和摘要等任务。
OpenAI 的 GPT-3：预训练数据量大，参数众多，能根据用户输入的任务描述或示例完成任务。
ChatGPT：用户通过像和人类对话的方式即可完成任务。
国内的优秀大模型有：
- 智谱清言（清华&智谱 AI）：基础模型为 ChatGLM 大模型。在工具使用排名国内第一，在计算、逻辑推理、传统安全能力上排名国内前三，更擅长专业能力，但代码能力有优化空间，知识百科稍显不足。可应用于 AI 智能体、较复杂推理、广告文案、文学写作等场景。
- 通义千问 2.0（阿里云）：在语言理解与抽取、角色扮演能力上排名国内前一，在代码、生成与创作、上下文对话能力上排名国内前三，各项能力较为均衡。聚焦在移动设备端的应用，涵盖知识、记忆、工具、创作等方向，支持多种工具和文生文、文生图等场景。
- Baichuan2-13B-Chat（百川智能）：百川智能自主训练的开源大语言模型，是中文开源模型的主导力量。

Content generated by AI large model, please carefully verify (powered by aily)

References

encoder-only:这些模型通常适用于可以自然语言理解任务，例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的，在transformer中，包括Encoder，Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢？第一，大模型的预训练数据非常大，这些数据往往来自于互联网上，包括论文，代码，以及可进行爬取的公开网页等等，一般来说，现在最先进的大模型一般都是用TB级别的数据进行预训练。第二，参数非常多，Open在2020年发布的GPT-3就已经达到170B的参数在GPT3中，模型可以根据用户输入的任务描述，或给出详细的例子，完成任务但这与我们熟知的ChatGPT仍然有着很大的差距，使用ChatGPT只需要像和人类一样对话，就可以完成任务。除了形式上的不同之外，还有一个更加重要的差距，那就是安全性上的差别。

2023年度中文大模型基准测评报告.pdf

智谱清言是智谱AI和清华大学推出的大模型产品，基础模型为ChatGLM大模型。2023年10月27日，智谱AI于2023中国计算机大会（CNCC）上，推出了全自研的第三代基座大模型ChatGLM3及相关系列产品。[heading4]模型特点：[content]智谱清言在工具使用排名国内第一，在计算、逻辑推理、传统安全能力上排名国内前三。总体来看，智谱清言更擅长专业能力，但在代码能力上还有一定优化空间。除此之外，知识百科与其他第一梯队模型相比稍显不足。综合来看，智谱清言是一个很有竞争力的大模型。适合应用：智谱清言可应用的场景相对广泛，根据SuperCLUE测评结果，优先推进在AI智能体方面相关的应用，包括任务规划、工具使用及一些长文本记忆相关的场景。另外在较复杂推理应用上的效果会比较不错。广告文案、文学写作方面也是一个很好的选择。

2023年度中文大模型基准测评报告.pdf

AndesGPT在语言理解与抽取、角色扮演能力上排名国内前一，在代码、生成与创作、上下文对话能力上排名国内前三。在专业技能和语言任务上均有不俗表现，综合来看，AndesGPT是一个各项能力较为均衡的大模型，在国内大模型厂商中比较有竞争力。适合应用：AndesGPT聚焦在移动设备端的应用。主要涵盖四个方向：知识、记忆、工具、创作。目前AndesGPT已支持使用“系统设置、一方应用、三方服务、代码解释器”等各类工具。并且AndesGPT已全面支持文生文、文生图等场景，可以为用户提供真实有用的技能。优秀模型：Baichuan2-13B-Chat（百川智能）[heading4]简介：[content]Baichuan2-13B-Chat是百川智能自主训练的开源大语言模型。百川智能于6月15日开源Baichuan1、9月6日开源Baichuan2，10月31日发布Baichuan2192K。是中文开源模型的主导力量。