Chat with Wiki - 闭源模型分类和典型案例

Answer

以下是一些常见的闭源模型分类和典型案例：

通用大模型：字节云雀大模型。
行业大模型：如蚂蚁金融大模型等。

在 2023 年，还有众多闭源模型的发布和升级，例如：

文心一言：经历了从 1.0 到 V3.5 的版本升级。
星火：科大讯飞发布的星火 1.0 及后续的升级版本。

此外，Qwen 系列模型也有出色表现，Qwen2 在性能上超越了目前所有开源模型和国内闭源模型，如文心 4.0 等。Qwen2 具有多种尺寸的预训练和指令调整模型，在大量基准评估中表现出先进的性能，提升了代码、数学、推理等多方面的能力，并在多个国际权威测评中获得冠军。

Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

时间2022.125字节云雀大模型闭源通用大模型百川BaichuanYi-34B开源医疗汽车教育行业大模型MindGPT部分领域岐黄问道银河大模型..................序列猴子BlueLMAndesGPT孟子玉言云天书金融工业文化/零售/交通蚂蚁金融大模型妙笔大模型AInno-15B轩辕大模型COSMO-GPTSMore LrMo..................2023年值得关注的中文大模型全景图国内外大模型发展趋势过去六个月国内外代表性模型的发展趋势趋势说明过去半年，国内领军大模型企业实现了大模型代际追赶的奇迹，从7月份与GPT3.5的20分差距，每个月都有稳定且巨大的提升，到11月份测评时已经完成总分上对GPT3.5的超越。

2023年度中文大模型基准测评报告.pdf

•OpenAI发布GPT4•科大讯飞发布星火1.0•百度发布文心一言1.0•清华开源ChatGLM•360发布360智脑1.0•复旦开源MOSS•元语开源ChatYuan•阿里云发布通义千问1.0•商汤科技发布商量1.0•昆仑万维发布天工1.0•出门问问发布序列猴子•华为发布盘古3.0•西湖心辰发布西湖大模型•文心一言升级V3.5•云从科技发布从容大模型•商汤科技升级商量2.0•理想汽车发布MindGPT•360升级智脑4.0•字节跳动公测大模型产品豆包•OPPO发布AndesGPT•商汤科技升级商量3.0•vivo发布BlueLM•阿里云开源Qwen-7B•零一万物开源Yi-34B•小米发布大模型MiLM•科大讯飞升级星火3.0•元象科技开源XVERSE-13B•Google发布多模态大模型Gemini•上海人工智能实验室开源InternLM-20B•百川智能发布Baichuan2—Turbo2月4月8月6月10月2023.12

Qwen 2开源了模型性能超越目前所有开源模型和国内闭源模型

5种尺寸的预训练和指令调整模型，包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B；（Qwen2-57B-A14B这个模型可以重点看看除英语和中文外，还接受过另外27种语言的数据训练；在大量基准评估中表现出最先进的性能；在大量基准评估中获得SOTA性能。代码和数学性能显著提高，全面超越llama3增大了上下文长度支持，最高达到128K tokens（Qwen2-72B-Instruct）。HF最新榜第一72B和7B可处理128k上下文57B-A14B可处理64k上下文0.5B和1.5B可处理32k上下文相比2月推出的通义千问Qwen1.5，Qwen2实现了整体性能的代际飞跃。在权威模型测评榜单OpenCompass中，此前开源的Qwen1.5-110B已领先于文心4.0等一众中国闭源模型。刚刚开源的Qwen2-72B，整体性能相比Qwen1.5-110B又取得了大幅提升。（图说：在上海人工智能实验室推出的OpenCompass大模型测评榜单上，此前开源的Qwen1.5-110B已领先于文心4.0等一众中国闭源模型）通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等国际权威测评中，Qwen2-72B获十几项世界冠军，超过美国的Llama3。（图说：Qwen2-72B在十多个权威测评中获得冠军，超过美国的Llama3-70B模型）