Chat with Wiki - 有什么开源大模型

Answer

以下是一些开源大模型：

Fengshenbang-LM：
- 地址：https://github.com/IDEA-CCNL/Fengshenbang-LM
- 简介：是 IDEA 研究院认知计算与自然语言研究中心主导的大模型开源体系，开源了姜子牙通用大模型 V1，是基于 LLaMa 的 130 亿参数的大规模预训练模型，具备翻译、编程、文本分类、信息抽取、摘要、文案生成、常识问答和数学计算等能力。除姜子牙系列模型之外，还开源了太乙、二郎神系列等模型。
BiLLa：
- 地址：https://github.com/Neutralzz/BiLLa
- 简介：开源了推理能力增强的中英双语 LLaMA 模型。较大提升 LLaMA 的中文理解能力，并尽可能减少对原始 LLaMA 英文能力的损伤；训练过程增加较多的任务型数据，利用 ChatGPT 生成解析，强化模型理解任务求解逻辑；全量参数更新，追求更好的生成效果。
Moss：
- 地址：https://github.com/OpenLMLab/MOSS
- 简介：支持中英双语和多种插件的开源对话语言模型，MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到，后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。
Qwen：
- 相关信息：国产大模型，多次冲进 LMSys 榜单，最早出现的是通义千问 14B 开源视频 Qwen-14B，后来是 Qwen 系列的 72B、110B 以及通义千问闭源模型 Qwen-Max，得分一个比一次高，LMSys 也曾官方发推认证通义千问开源模型的实力。Qwen 系列开源模型的累计下载量突破了 1600 万，国内外有海量开发者都基于 Qwen 开发了自己的模型和应用。
Grok-1：
- 地址：https://github.com/xai-org/grok-1
- 简介：拥有 3140 亿参数的专家混合模型，使用旋转位置嵌入，词汇量达到 131,072，未针对任何特定应用程序进行微调。

Content generated by AI large model, please carefully verify (powered by aily)

References

Fengshenbang-LM：地址：[https://github.com/IDEA-CCNL/Fengshenbang-LM](https://github.com/IDEA-CCNL/Fengshenbang-LM)简介：Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系，该项目开源了姜子牙通用大模型V1，是基于LLaMa的130亿参数的大规模预训练模型，具备翻译，编程，文本分类，信息抽取，摘要，文案生成，常识问答和数学计算等能力。除姜子牙系列模型之外，该项目还开源了太乙、二郎神系列等模型。BiLLa：地址：[https://github.com/Neutralzz/BiLLa](https://github.com/Neutralzz/BiLLa)简介：该项目开源了推理能力增强的中英双语LLaMA模型。模型的主要特性有：较大提升LLaMA的中文理解能力，并尽可能减少对原始LLaMA英文能力的损伤；训练过程增加较多的任务型数据，利用ChatGPT生成解析，强化模型理解任务求解逻辑；全量参数更新，追求更好的生成效果。Moss：地址：[https://github.com/OpenLMLab/MOSS](https://github.com/OpenLMLab/MOSS)简介：支持中英双语和多种插件的开源对话语言模型，MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到，后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。

早些时候，有人做了个LMSys榜单一年动态变化视频。过去一年内，国产大模型只有Qwen多次冲进这份榜单，最早出现的是通义千问14B开源视频Qwen-14B，后来是Qwen系列的72B、110B以及通义千问闭源模型Qwen-Max，得分一个比一次高，LMSys也曾官方发推认证通义千问开源模型的实力。在顶尖模型公司的竞争中，目前为止中国模型只有通义千问真正入局，能与头部厂商一较高下。开发者用脚投票的结果，显示了Qwen系列的受欢迎程度。目前为止，Qwen系列开源模型的累计下载量突破了1600万，国内外有海量开发者都基于Qwen开发了自己的模型和应用，尤其是企业级的模型和应用。Qwen的很多忠实拥趸是海外开发者，他们时常在社交平台发表“我们为什么没有这种模型”的溢美之词（配图详见附件）。可以说，通义大模型用行动证明了开源开放的力量。七、为什么大模型的生态建设如此重要？AI大模型是全球数字技术体系的竞争，这个体系包括芯片、云计算、闭源模型、开源模型、开源生态等等。中国信息化百人会执委、阿里云副总裁安筱鹏指出，全球AI大模型竞争的制高点是AI基础大模型，因为基础大模型决定了产业智能化的天花板，商业闭环的可能性，应用生态的繁荣以及产业竞争的格局。与此同时，开源生态在整个技术体系的竞争中也有着至关重要的作用。

XiaoHu.AI日报

?Xiaohu.AI日报「3月16日-17日」✨✨✨✨✨✨✨✨1⃣️?MediaCrawler：一键抓取工具支持小红书、抖音、快手、B站和微博等平台内容抓取。集成IP代理池，防封。支持视频、图片、评论等多种数据格式保存。?https://github.com/NanmiCoder/MediaCrawler?https://x.com/imxiaohu/status/1769569874601546034?s=202⃣️?Open-Sora开源项目完整的文本到视频模型训练过程。采用优于VideoGPT的VAE模型。支持DiT、Latte和PixArt的官方权重推理。?https://github.com/hpcaitech/Open-Sora?https://x.com/imxiaohu/status/1769553076476920264?s=203⃣️?x.AI开源大语言模型Grok-1拥有3140亿参数的专家混合模型。使用旋转位置嵌入，词汇量达到131,072。未针对任何特定应用程序进行微调。?https://x.com/imxiaohu/status/1769536692078428321?s=20?https://x.ai/blog/grok-os?https://github.com/xai-org/grok-14⃣️?OpenRouter：大语言模型“路由器”提供统一接口访问和使用几十种AI模型。支持GPT、LLama、Claude、Command-R等80多个模型。