Chat with Wiki - 列出国内的所有大模型

Answer

以下是国内的部分大模型：

北京企业机构：
- 百度：文心一言，https://wenxin.baidu.com
- 抖音：云雀大模型，https://www.doubao.com
- 智谱 AI：GLM 大模型，https://chatglm.cn
- 中科院：紫东太初大模型，https://xihe.mindspore.cn
- 百川智能：百川大模型，https://www.baichuan-ai.com/
上海企业机构：
- 商汤：日日新大模型，https://www.sensetime.com/
- MiniMax：ABAB 大模型，https://api.minimax.chat
- 上海人工智能实验室：书生通用大模型，https://intern-ai.org.cn
其他地区：
- 阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中。
- 广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品。

此外，通义千问的 Qwen 系列在 LMSys 榜单中表现出色，其开源模型受欢迎，累计下载量突破 1600 万，国内外有海量开发者基于其开发模型和应用。大模型的竞争涉及芯片、云计算、闭源模型、开源模型、开源生态等，基础大模型决定产业智能化的天花板等，开源生态也至关重要。

Content generated by AI large model, please carefully verify (powered by aily)

References

8月正式上线的国内大模型

5⃣️五家北京企业机构：百度（文心一言）https://wenxin.baidu.com抖音（云雀大模型）https://www.doubao.com智谱AI（GLM大模型）https://chatglm.cn中科院（紫东太初大模型）https://xihe.mindspore.cn百川智能（百川大模型）https://www.baichuan-ai.com/3⃣️三家上海企业机构：商汤（日日新大模型）https://www.sensetime.com/MiniMax（ABAB大模型）https://api.minimax.chat上海人工智能实验室（书生通用大模型）https://intern-ai.org.cn今天这8个大模型，在聊天状态下——能生成Markdown格式的：智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的：昇思（可以对文本进行是否由AI生成的检测，类似论文查重，准确度不错）、书生受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有15元的预充值额度进行体验，完成企业认证后可以进行充值）特色功能：昇思——生图，MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中，广东省2家和其他省市1家也将陆续开放据悉，广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品

02-基础通识课

[heading2]总结大语言模型的介绍与原理国内大模型的分类：国内大模型有通用模型如文心一言、讯飞星火等，处理自然语言；还有垂直模型，专注特定领域如小语种交流、临床医学、AI蛋白质结构预测等。大模型的体验：以‘为什么我爸妈结婚的时候没有邀请我参加婚礼’和‘今天我坐在凳子上’为例，体验了Kimi、通义千问、豆包等大模型的回答和续写能力，发现回复有差异，且大模型基于统计模型预测生成内容。大语言模型的工作原理：大语言模型工作原理包括训练数据、算力、模型参数，在训练数据一致情况下，模型参数越大能力越强，参数用b链形容大小。Transformer架构：Transformer是大语言模型训练架构，17年出现用于翻译，具备自我注意力机制能理解上下文和文本关联，其工作原理是单词预测，通过嵌入、位置编码、自注意力机制生成内容，模型调教中有控制输出的temperature。关于大语言模型的原理、应用及相关概念Transformer模型原理：通过不断检索和匹配来寻找依赖关系，处理词和词之间的位置组合，预测下一个词的概率，是一个偏向概率预测的统计模型。大模型幻觉：大模型通过训练数据猜测下一个输出结果，可能因错误数据导致给出错误答案，优质数据集对其很重要。Prompt的分类和法则：分为system prompt、user prompt和assistant prompt，写好prompt的法则包括清晰说明、指定角色、使用分隔符、提供样本等，核心是与模型好好沟通。Fine tuning微调：基于通用大模型，针对特定领域任务提供数据进行学习和调整，以适应特定领域的需求。RAG概念：未对RAG的具体内容进行详细阐述，仅提出了这个概念。

早些时候，有人做了个LMSys榜单一年动态变化视频。过去一年内，国产大模型只有Qwen多次冲进这份榜单，最早出现的是通义千问14B开源视频Qwen-14B，后来是Qwen系列的72B、110B以及通义千问闭源模型Qwen-Max，得分一个比一次高，LMSys也曾官方发推认证通义千问开源模型的实力。在顶尖模型公司的竞争中，目前为止中国模型只有通义千问真正入局，能与头部厂商一较高下。开发者用脚投票的结果，显示了Qwen系列的受欢迎程度。目前为止，Qwen系列开源模型的累计下载量突破了1600万，国内外有海量开发者都基于Qwen开发了自己的模型和应用，尤其是企业级的模型和应用。Qwen的很多忠实拥趸是海外开发者，他们时常在社交平台发表“我们为什么没有这种模型”的溢美之词（配图详见附件）。可以说，通义大模型用行动证明了开源开放的力量。七、为什么大模型的生态建设如此重要？AI大模型是全球数字技术体系的竞争，这个体系包括芯片、云计算、闭源模型、开源模型、开源生态等等。中国信息化百人会执委、阿里云副总裁安筱鹏指出，全球AI大模型竞争的制高点是AI基础大模型，因为基础大模型决定了产业智能化的天花板，商业闭环的可能性，应用生态的繁荣以及产业竞争的格局。与此同时，开源生态在整个技术体系的竞争中也有着至关重要的作用。