Chat with Wiki - 当前国内逻辑推理能力最强的大模型是什么

Answer

目前国内逻辑推理能力较强的大模型有以下几种：

Baichuan2-13B-Chat（百川智能）：是百川智能自主训练的开源大语言模型。在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名 200 亿参数量级国内模型第一，其中逻辑推理能力超过 34B 参数量级的大模型，生成与创作能力超过 72B 参数量级的模型。可应用于小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景，还能部署在教育、医疗、金融等垂直行业中应用，同时可部署在低算力终端处理基础智能任务。
智谱清言（清华&智谱 AI）：是智谱 AI 和清华大学推出的大模型产品，基础模型为 ChatGLM 大模型。在工具使用排名国内第一，在计算、逻辑推理、传统安全能力上排名国内前三。可应用于 AI 智能体方面相关的应用，包括任务规划、工具使用及一些长文本记忆相关的场景，在较复杂推理应用上的效果也不错，广告文案、文学写作方面也是很好的选择。
文心一言 4.0-API（百度）：在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一。另外在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。能力栈较为广泛，可应用于查询搜索知识应用、任务拆解规划 Agent、文案写作以及代码编写及纠错等方面，在科学研究、教育、工业方面的落地能力也值得关注。

Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

简介：Baichuan2-13B-Chat是百川智能自主训练的开源大语言模型。百川智能于6月15日开源Baichuan1、9月6日开源Baichuan2，10月31日发布Baichuan2192K。是中文开源模型的主导力量。模型特点：Baichuan2-13B-Chat在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名200亿参数量级国内模型第一，其中逻辑推理能力超过34B参数量级的大模型，生成与创作能力超过72B参数量级的模型，表现不俗。在计算和代码能力上有一定优化空间。综合来看，Baichuan2-13B-Chat在同等量级开源模型中非常有竞争力。适合应用：Baichuan2-13B-Chat可应用的场景相对广泛且可以私有化部署。重点推荐在小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景。另外，Baichuan2-13B-Chat可以部署在教育、医疗、金融等垂直行业中应用，同时可部署在低算力终端处理基础智能任务。

2023年度中文大模型基准测评报告.pdf

简介：智谱清言是智谱AI和清华大学推出的大模型产品，基础模型为ChatGLM大模型。2023年10月27日，智谱AI于2023中国计算机大会（CNCC）上，推出了全自研的第三代基座大模型ChatGLM3及相关系列产品。模型特点：智谱清言在工具使用排名国内第一，在计算、逻辑推理、传统安全能力上排名国内前三。总体来看，智谱清言更擅长专业能力，但在代码能力上还有一定优化空间。除此之外，知识百科与其他第一梯队模型相比稍显不足。综合来看，智谱清言是一个很有竞争力的大模型。适合应用：智谱清言可应用的场景相对广泛，根据SuperCLUE测评结果，优先推进在AI智能体方面相关的应用，包括任务规划、工具使用及一些长文本记忆相关的场景。另外在较复杂推理应用上的效果会比较不错。广告文案、文学写作方面也是一个很好的选择。

2023年度中文大模型基准测评报告.pdf

信息安全相关的在线课程和讲座[blo优秀模型：文心一言4.0-API（百度）简介：文心一言（英文名：ERNIE Bo t）是百度全新一代知识增强大语言模型。于2023年3月16日正式发布，已进行多个版本迭代，10月17日发布V4.0版本。据百度官方介绍，文心一言目前已有7000万用户。模型特点：文心一言4.0在计算、逻辑推理、生成与创作、传统安全这4大基础能力上排名国内第一。另外在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三。文心一言4.0各项能力上表现非常均衡且绝大部分能力有很高的水平，综合来看是国内非常有竞争力的大模型。适合应用：文心一言4.0的能力栈较为广泛，可应用的场景较多。基于在SuperCLUE测评上的表现，重点推荐在查询搜索知识应用、任务拆解规划Agent、文案写作以及代码编写及纠错等方面的应用。另外文心一言4.0由于在逻辑推理方面的不俗表现，可以重点关注在科学研究、教育、工业方面的落地能力。