Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

帮我列举2025年3月1日以来,国内外、闭源开源模型厂商的更新记录。

Answer

以下是 2025 年 3 月 1 日以来,国内外、闭源开源模型厂商的部分更新记录:

  • 2025 年 3 月 20 日,OpenAI 推出了一套全新的音频模型,旨在通过 API 为开发者提供更智能、更可定制的语音代理支持,包括改进的语音转文本和文本转语音功能,为语音交互应用带来显著提升。
  • 李开复公开表示 OpenAI 面临生存危机,商业模式不可持续。他强调中国的 DeepSeek 以极低成本提供接近的性能,开源模式将主导未来 AI 发展。他认为企业级 AI 应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大 AI 玩家,竞争愈发激烈。
  • SuperCLUE 发布《中文大模型基准测评 2025 年 3 月报告》,指出 2022 - 2025 年经历多阶段发展,国内外模型差距缩小。测评显示 o3-mini(high)总分领先,国产模型表现亮眼,如 DeepSeek-R1 等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek 系列模型深度分析表明,其 R1 在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。

以上信息来源包括:

Content generated by AI large model, please carefully verify (powered by aily)

References

通往AGI之路

《[李开复公开表示:OpenAI正面临生存危机,中国模式才是AI未来](https://mp.weixin.qq.com/s/VgfRavJODzoJCIfJv0-KHA)》李开复在采访中指出,OpenAI面临生存危机,商业模式不可持续。他强调,中国的DeepSeek以极低成本提供接近的性能,开源模式将主导未来AI发展。他认为,企业级AI应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大AI玩家,竞争愈发激烈。《[OpenAI新一代音频模型使用说明文档](https://waytoagi.feishu.cn/wiki/TJKfwjj8fiWr3Qker0ucZFLdnOh)》OpenAI于2025年3月20日推出了一套全新的音频模型,旨在通过API为开发者提供更智能、更可定制的语音代理支持。这些模型包括改进的语音转文本(Speech-to-Text)和文本转语音(Text-to-Speech)功能,为语音交互应用带来了显著提升。SuperCLUE:《[中文大模型基准测评2025年3月报告](https://waytoagi.feishu.cn/record/VL0MrU05feLhnGcXJcxcdsXRn6D)》在关键进展上,2022-2025年经历多阶段发展,国内外模型差距缩小。测评方面,SuperCLUE从多维度对45个模型评估,结果显示o3-mini(high)总分领先,国产模型表现亮眼,如DeepSeek-R1等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek系列模型深度分析表明,其R1在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。

4.4 历史更新

《[李开复公开表示:OpenAI正面临生存危机,中国模式才是AI未来](https://mp.weixin.qq.com/s/VgfRavJODzoJCIfJv0-KHA)》李开复在采访中指出,OpenAI面临生存危机,商业模式不可持续。他强调,中国的DeepSeek以极低成本提供接近的性能,开源模式将主导未来AI发展。他认为,企业级AI应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大AI玩家,竞争愈发激烈。《[OpenAI新一代音频模型使用说明文档](https://waytoagi.feishu.cn/wiki/TJKfwjj8fiWr3Qker0ucZFLdnOh)》OpenAI于2025年3月20日推出了一套全新的音频模型,旨在通过API为开发者提供更智能、更可定制的语音代理支持。这些模型包括改进的语音转文本(Speech-to-Text)和文本转语音(Text-to-Speech)功能,为语音交互应用带来了显著提升。SuperCLUE:《[中文大模型基准测评2025年3月报告](https://waytoagi.feishu.cn/record/VL0MrU05feLhnGcXJcxcdsXRn6D)》在关键进展上,2022-2025年经历多阶段发展,国内外模型差距缩小。测评方面,SuperCLUE从多维度对45个模型评估,结果显示o3-mini(high)总分领先,国产模型表现亮眼,如DeepSeek-R1等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek系列模型深度分析表明,其R1在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。

3月22日 社区动态速览

《[李开复公开表示:OpenAI正面临生存危机,中国模式才是AI未来](https://mp.weixin.qq.com/s/VgfRavJODzoJCIfJv0-KHA)》李开复在采访中指出,OpenAI面临生存危机,商业模式不可持续。他强调,中国的DeepSeek以极低成本提供接近的性能,开源模式将主导未来AI发展。他认为,企业级AI应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大AI玩家,竞争愈发激烈。《[OpenAI新一代音频模型使用说明文档](https://waytoagi.feishu.cn/wiki/TJKfwjj8fiWr3Qker0ucZFLdnOh)》OpenAI于2025年3月20日推出了一套全新的音频模型,旨在通过API为开发者提供更智能、更可定制的语音代理支持。这些模型包括改进的语音转文本(Speech-to-Text)和文本转语音(Text-to-Speech)功能,为语音交互应用带来了显著提升。SuperCLUE:《[中文大模型基准测评2025年3月报告](https://waytoagi.feishu.cn/record/VL0MrU05feLhnGcXJcxcdsXRn6D)》在关键进展上,2022-2025年经历多阶段发展,国内外模型差距缩小。测评方面,SuperCLUE从多维度对45个模型评估,结果显示o3-mini(high)总分领先,国产模型表现亮眼,如DeepSeek-R1等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek系列模型深度分析表明,其R1在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。

Others are asking
2025年人工智能大模型的技术提升有哪些,是参数?推理能力?还是语料
2025 年人工智能大模型的技术提升可能体现在以下几个方面: 1. 视频生成能力:如 2024 年推出的多个先进的 AI 模型能够从文本输入生成高质量视频,相比 2023 年有显著进步。 2. 模型规模与性能:更小的模型能驱动更强的性能,如 2022 年最小能在 MMLU 上得分高于 60%的模型是具有 5400 亿参数的 PaLM,到 2024 年,参数仅 38 亿的微软 Phi3mini 也能达到相同阈值。 3. 推理能力:尽管加入了如思维链推理等机制显著提升了大语言模型的性能,但在一些需要逻辑推理的问题上,如算术和规划,尤其在超出训练范围的实例上,这些系统仍存在问题。 4. AI 代理:在短时间预算设置下,顶级 AI 系统得分高于人类专家,但随着时间预算增加,人类表现会超过 AI。 5. 算法变革:如 DeepSeek 的出现标志着算力效率拐点显现,其通过优化算法架构显著提升了算力利用效率,同时 2025 年发布的大模型呈现低参数量特征,为本地化部署到 AI 终端运行提供了可能,其训练过程聚焦于强化学习,提升了模型的推理能力。
2025-04-14
2025年4月以来有什么突破性的ai技术?
以下是 2025 年 4 月以来的一些突破性 AI 技术及相关进展: 在图片和超短视频的精细操控方面,包括表情、细致动作以及视频与文字的匹配有了新的突破。 有一定操控能力的生成式短视频在风格化和动漫风方面最先成熟,真人风格稍晚。 AI 音频能力有长足进展,带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频并直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟,在记忆方面有明显突破,能较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 2025 年 4 月的具体进展包括: 真格基金的戴雨森认为,AI 时代即将迎来各行业的“李世石时刻”。OpenAI 的 o1 和 DeepSeek 的 R1 模型分别在后训练和开源创新方面展现了强大潜力,推动了强化学习的应用。 马斯克在最新演讲中警告 AI 可能只是为取悦企业而非追求真相,并强调教育中 AI 的个性化应用将深远影响学习。他预测特斯拉 Robotaxi 将在 6 月实现完全自动驾驶,同时期待神经连接技术能帮助失明者重见光明。 此外,《人工智能指数报告 2025》(AI Index Report 2025)由斯坦福大学人工智能研究院(HAI)发布,报告涵盖了 AI 在技术性能、经济影响、政策治理、教育、公众舆论、科学与医学等多个维度的最新进展。关键发现包括:AI 技术性能持续突破,在新设立的高难度基准测试上表现大幅提升;AI 日益融入日常生活,如 FDA 批准的 AI 医疗设备增多,自动驾驶服务扩展;企业全面拥抱 AI,美国私营 AI 投资增加,使用 AI 的企业比例上升;中美 AI 竞争加剧,美国主导 AI 模型数量,中国模型在质量上迅速追赶;负责任 AI(RAI)发展不均。报告地址:https://hai.stanford.edu/aiindex/2025aiindexreport 。
2025-04-13
2025年AI研究报告
以下是为您提供的 2025 年 AI 研究报告相关信息: Gartner:《生成式 AI 时代下科技产品的重要发展机遇》(2024/10/16) 强调了生成式 AI 技术对对话式 AI 和科技产品创新的显著影响。 预计到 2025 年,生成式 AI 将嵌入 80%的对话式 AI 产品中,推动市场营收大幅增长。 建议技术供应商积极把握机遇,通过理解市场动态、技术成熟度和市场接受度来调整策略。 生成式 AI 的四大关键能力—对话式 AI、AI 代理、合成数据和个性化—能够提升产品价值和客户体验。 提出了将生成式 AI 功能添加到产品中的四个关键步骤,并强调了独立软件供应商在企业应用中嵌入生成式 AI 能力的趋势。 如需下载研究报告,。 甲子光年:2025 DeepSeek 开启 AI 算法变革元年(2025/02/05) DeepSeek 的出现标志着算力效率拐点显现,其通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知。 2025 年发布的大模型呈现低参数量特征,为本地化部署到 AI 终端运行提供了可能。 报告强调 2025 年是算法变革的元年,DeepSeek 的推理模型开启了算法变革,其训练过程聚焦于强化学习,提升了模型的推理能力。 非 Transformer 架构的算法模型成为新的发展方向,如 LFM 架构模型性能超越同等规模的 Transformer 模型。 如需下载研究报告,。 安永:数据+AI 开启经验规模化复制时代(2023/12/19) 人工智能正在经历新的发展浪潮。 某头部公司正在转向 AI Agents 支持平台,结合第 4 代人工智能模型与专业语料库以实现业务创新。 AI Agents 有望为商业领域注入新活力,展示人工智能的潜力和商业价值。 随着平台的发展,新的 AI Agents 涌现,提供专业化、高端化、个性化、规模化、持续化的服务。 人工智能的革新涵盖了生成内容(AIGC)和生成服务(AIGS)的领域。 保险行业面临挑战,AI 的突破为其带来新的应对方向。 知识星球下载: 弘则研究:2023 生成式 AI 驱动向量数据库加速发展(2023/12/18) 向量数据库潜在市场空间是传统结构化关系型数据库的数倍达到千亿美元。 据信通院统计数据,全球数据库市场规模在 2020 年为 671 亿美元,到 2025 年有望达到 798 亿美元,CAGR 3.5%估算关系型数据库全球龙头 Oracle 收入规模小几百亿美元。 仅考虑现有非结构化数据的向量化处理,估算需要的存储空间增量为之前的数倍。 未来随着生成式 AI 应用增量数据的爆发对于向量数据库的需求会更大。 报告下载地址:
2025-04-09
有哪些完整综观地阐述了2022年到2025年AIGC相关技术和在设计领域的应用发展的研究报告
以下是为您找到的一些可能符合您需求的研究报告: 1. 月狐数据联合发布的《AI 产业全景洞察报告 2025》,深入分析了全球及中国人工智能产业的发展现状、全景图谱及企业出海情况。指出全球 AI 产业保持 19.1%的年均增长率,2024 年第三季度交易数量达 1245 笔,融资规模显著提升。美国在 AI 领域融资和应用市场中占据主导地位,中国紧随其后,2024 年一季度大模型规模占全球的 36%。国内 AI 企业出海呈现增长趋势,工具类和图像处理类应用在海外市场受欢迎,但东南亚和东亚地区付费习惯尚未形成。还展示了 AI 在各行业的应用现状,包括智慧医疗、智慧教育、企业服务等,强调了 AIGC 技术在提升用户体验和推动产业发展中的关键作用。链接:https://waytoagi.feishu.cn/record/DFqRrh4kqeqaIFchKtocVwVkn2d 2. 甲子光年的《2025 具身智能行业发展研究报告:具身智能技术发展与行业应用简析》,指出具身智能作为具备物理载体的智能体,强调通过与环境的交互实现智能行为,是人工智能与机器人技术的深度融合。当前,具身智能正处于技术萌芽期,受大模型技术推动成为热点,但在数据采集、模型泛化、技术路线等方面仍面临挑战。报告分析了具身智能的发展背景、现状及应用场景,认为中国在具身智能领域已走在国际前列,具备庞大的市场需求、完善的产业集群和良好的政策支持。链接:https://waytoagi.feishu.cn/record/TERPru4Jee7Gzbcu54WcUjsXnJh 3. 智能纪要:【跨界·未来】AIGC×视觉交互工作坊 Part1:AI 应用前瞻 2025 年 3 月 11 日。涵盖了 AI 在艺术创作中的应用与探索,包括 Lora 模型训练素材、模型训练比赛、Checkpoint 模型、线上与本地工作流、学习资源推荐、AI 创作挑战、装置艺术脉络、机械装置艺术理论、国内外装置艺术区别、AIGC 艺术尝试、机械进化与装置创作等方面。
2025-03-31
有哪些完整综观地阐述了2022年到2025年AIGC相关技术和应用发展的研究报告
以下是一些完整综观地阐述了 2022 年到 2025 年 AIGC 相关技术和应用发展的研究报告: 1. 月狐数据联合发布的《AI 产业全景洞察报告 2025》,深入分析了全球及中国人工智能产业的发展现状、全景图谱及企业出海情况。指出全球 AI 产业保持 19.1%的年均增长率,2024 年第三季度交易数量达 1245 笔,融资规模显著提升。美国在 AI 领域融资和应用市场中占据主导地位,中国紧随其后,2024 年一季度大模型规模占全球的 36%。国内 AI 企业出海呈现增长趋势,工具类和图像处理类应用在海外市场受欢迎,但东南亚和东亚地区付费习惯尚未形成。还展示了 AI 在各行业的应用现状,强调了 AIGC 技术在提升用户体验和推动产业发展中的关键作用。链接:https://waytoagi.feishu.cn/record/DFqRrh4kqeqaIFchKtocVwVkn2d 2. 甲子光年的《2025 具身智能行业发展研究报告:具身智能技术发展与行业应用简析》,指出具身智能作为具备物理载体的智能体,强调通过与环境的交互实现智能行为,是人工智能与机器人技术的深度融合。当前,具身智能正处于技术萌芽期,受大模型技术推动成为热点,但在数据采集、模型泛化、技术路线等方面仍面临挑战。分析了具身智能的发展背景、现状及应用场景,认为中国在具身智能领域已走在国际前列,具备庞大的市场需求、完善的产业集群和良好的政策支持。链接:https://waytoagi.feishu.cn/record/TERPru4Jee7Gzbcu54WcUjsXnJh 3. Celent 的《利用 AI 在支付领域的优势》,讨论了生成式人工智能的潜力和银行业对此的积极探索,并预测 AI 将在提高支付处理效率和创造新的收入流方面发挥关键作用。链接:https://waytoagi.feishu.cn/record/Cwtnr6KSIeL8JDcmljZcc55onPx 4. 华西证券的 AIGC 行业深度报告(14):《从英伟达到华为,零部件迎来大机遇》,英伟达的新一代 GPU 架构将带来零部件的升级,同时,华为的昇腾 910C 芯片和 Atlas 900 SuperCluster 展示了国产算力集群的潜力。链接:https://waytoagi.feishu.cn/record/UXR3rwzGSe92xLcLqFmcRpnhnUc 5. 《2024 端到端自动驾驶行业研究报告》,通过访谈 30 余位专家,分析了端到端技术的发展、主要参与者、驱动力和挑战。预计到 2025 年,模块化端到端系统将开始商业化应用,推动技术、市场和产业格局的变革。链接:https://waytoagi.feishu.cn/record/QBnRra7VfexdazctR1Acc5YGn6d 6. 微软的《释放英国的 AI 潜力:利用 AI 促进经济增长》,英国拥有先进的科技行业和数字优势,但与其他国家相比领先优势有限,英国面临基础设施、数字技能和数字技术采用的瓶颈。链接:https://waytoagi.feishu.cn/record/K1bfraBc7eMFvOc1T21cto8rnhh
2025-03-31
2025年3月27日AI新闻
以下是 2025 年 3 月 27 日的部分 AI 新闻: 《详解 MCP:Agentic AI 中间层最优解,AI 应用的标准化革命》:Anthropic 推出的开放协议 MCP 迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口。它简化了开发者与数据源的整合,促进了生态形成,可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《对谈|如何用 AI 增强人类学习》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调输出能迫使知识内化。两位终身学习者分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。 《硅谷知名风投 BVP 专栏:消费级 AI 的临界点将至!》:消费级 AI 正迎来临界点,推动一波又一波的变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司不断涌现。未来,AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。 此外,2 月 27 日的相关新闻有:小红书 AI 赛道从 0 到 1 做 IP 的相关活动预告、工具分享及日更群计划。3 月 5 日的新闻包括:2025 开年 3 个月 AI 已经狂飙,更新密集发布;Grok 语音模式全面开放,支持 11 种模式(包括 2 种 18 禁),自带语音字幕,目前仅支持英文。
2025-03-27
自动生成提示词的开源工具有哪些
以下是一些自动生成提示词的开源工具: 1. Freepik 推出的 Reimagine AI 工具:用户上传图片即可自动生成提示词,无需输入文字。它还能实时提供无限滚动结果展示,边操作边生成图像,通过调整提示词实时修改图片细节,并支持多种风格切换。相关链接:https://freepik.com/pikaso/reimagine 、https://x.com/imxiaohu/status/1770437135738581414?s=20 2. StreamMultiDiffusion 项目:使用区域文本提示实时生成图像,具有交互式操作体验,每个提示控制一个区域,实现精准图像生成。相关链接:https://arxiv.org/abs/2403.09055 、https://github.com/ironjr/StreamMultiDiffusion?tab=readmeovfile 、https://huggingface.co/spaces/ironjr/SemanticPalette 、https://x.com/imxiaohu/status/1770371036967850439?s=20 3. 【SD】自动写提示词脚本 One Button Prompt:可以在主菜单输入人物提示词,在“高级”中设置提示词混合,还具有一键运行放大的模块,包括完整的文生图放大和图生图放大,甚至可接入其他脚本和 controlnet。获取方式:添加公众号【白马与少年】,回复【SD】。
2025-04-12
开源flux模型如何快速使用
以下是关于开源 Flux 模型快速使用的方法: 1. 模型的下载: 如果因为环境问题,可以在网盘中下载。 siglipso400mpatch14384(视觉模型):siglip 由 Google 开发的视觉特征提取模型,负责理解和编码图像内容。工作流程包括接收输入图像、分析图像的视觉内容并将这些视觉信息编码成一组特征向量。打开 ComfyUI\models\clip,在地址栏输入 CMD 回车,打开命令行,输入下面的命令拉取模型(也可以在网盘里下载)。 image_adapter.pt(适配器):连接视觉模型和语言模型,优化数据转换。工作流程包括接收来自视觉模型的特征向量、转换和调整这些特征,使其适合语言模型处理。通过 https://huggingface.co/spaces/fancyfeast/joycaptionprealpha/tree/main/wpkklhc6 下载,放到 models 的 Joy_caption 文件夹里,如果该文件夹不存在,就新建一个。 MetaLlama3.18Bbnb4bit(语言模型):大型语言模型,负责生成文本描述。工作流程包括接收经过适配器处理的特征、基于这些特征生成相应的文本描述、应用语言知识来确保描述的连贯性和准确性。打开 ComfyUI\models\LLM,地址栏输入 CMD 回车,在命令行里面输入下面命令。 2. 下载地址: ae.safetensors 和 flux1dev.safetensors 下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 准备了夸克和百度的网盘链接,方便部分同学下载: flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型(体积较大)的百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。 如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,速度会快很多,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。 3. 工作流下载: 最后我们再下载 dev 的工作流: 。或者下面官方原版的图片链接,图片导入 comfyUI 就是工作流:https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。我们打开 ComfyUI,把工作流或图片拖拽到 ComfyUI 里。
2025-04-08
开源AI Agent软件有哪些
以下是一些开源的 AI Agent 软件: 1. AutoGPT 和 BabyAGI:在去年 GPT4 刚发布时风靡全球科技圈,给出了让 LLM 自己做自动化多步骤推理的解题思路。 2. Coze:新一代的一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成了丰富的插件工具。 3. Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 4. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据自身需求打造大模型时代的产品能力。 5. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 6. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 7. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 此外,智谱·AI 开源的语言模型中也有与 Agent 相关的,如 AgentLM7B、AgentLM13B、AgentLM70B 等。
2025-03-29
mcp 有什么开源的方案吗
Anthropic 于 2024 年 11 月推出并开源了 MCP(模型上下文协议)。MCP 就像一个“转接头”或“通用插座”,能统一不同的外部服务,如 Google Drive、GitHub、Slack、本地文件系统等,通过标准化接口与大语言模型对接。开发者基于 MCP 规范开发一次“接口适配器”(MCP 服务器),就能让所有兼容 MCP 的模型(MCP 客户端)无缝接入,无需针对每个模型单独适配,大幅提升兼容性与开发效率。MCP 里面还包含 SSE(ServerSent Events),是一种允许服务器向浏览器推送实时更新的技术。MCP 像为 AI 模型量身定制的“USBC 接口”,可以标准化地连接 AI 系统与各类外部工具和数据源。与传统 API 相比,MCP 是单一协议,只要一次整合就能连接多个服务;具有动态发现功能,AI 模型能自动识别并使用可用的工具;支持双向通信,模型不仅能查询数据,还能主动触发操作。相关链接:
2025-03-27
现在Ai作图用什么?还是以前的Stable Diffusion吗?还是又出现了新的开源软件?
目前在 AI 作图领域,Stable Diffusion 仍然是常用的工具之一。Stable Diffusion 是 AI 绘画领域的核心模型,能够进行文生图和图生图等图像生成任务,其完全开源的特点使其能快速构建强大繁荣的上下游生态。 除了 Stable Diffusion,也出现了一些新的相关开源软件和工具,例如: :Stability AI 开源的 AI 图像生成平台。 :拥有超过 700 种经过测试的艺术风格,可快速搜索查找各类艺术家,并支持一键复制 Prompt。 同时,市面上主流的 AI 绘图软件还有 Midjourney,其优势是操作简单方便,创作内容丰富,但需要科学上网并且付费。如果您想尝试使用 Stable Diffusion,可以参考 B 站【秋葉 aaaki】这个 Up 主的视频了解具体的安装方法。
2025-03-24
有哪些效果好的开源OCR模型值得推荐
以下是一些效果较好的开源 OCR 模型推荐: 1. Mistral OCR:当前最强的 OCR 模型,具有多语言支持,超越 Gemini 2.0 Flash,可在 Le Chat 及 API 调用。ElevenLabs 赠送 $25 Mistral API 额度,免费领取!领取地址: 2. Gemini 2.0 Flash:也是一款 OCR 模型。
2025-03-24
列举出不同的 embedding模型
以下是不同的 embedding 模型: 1. 词嵌入: Word2Vec:包括 CBOW(Continuous BagofWords)和 SkipGram 模型,由 Google 提出,用于学习单词之间的语义关系。 GloVe(Global Vectors for Word Representation):由斯坦福大学开发,旨在结合全局统计信息和局部上下文窗口的优势来生成单词嵌入。 FastText:由 Facebook AI 团队推出,不仅考虑单个单词,还考虑内部字符 ngram,对于罕见词汇有更好的表现。 ELMo(Embeddings from Language Models):利用双向 LSTM 对整个句子进行建模,产生上下文敏感的单词嵌入。 2. 情景化的词嵌入: BERT(Bidirectional Encoder Representations from Transformers):由 Google 推出,利用 Transformer 架构的预训练模型,能够根据上下文提供动态的单词嵌入。 GPT(Generative Pretraining Transformer)及其后续版本 GPT2/3/4:由 OpenAI 开发,也是基于 Transformer 的自回归模型,同样能产出上下文相关的嵌入。 XLNet、RoBERTa 等都是 BERT 之后改进或扩展的预训练模型。 3. 句子和文档嵌入: Doc2Vec:扩展了 Word2Vec,能够为整个文档生成统一的向量表示。 Average Word Embeddings:将一段文本中所有单词的嵌入取平均作为整体的文本表示。 Transformers Sentence Embeddings:如 BERT 的标记对应的向量,或者专门针对句子级别的模型如 SentenceBERT。 4. 实体/概念嵌入: Knowledge Graph Embeddings:如 TransE、DistMult、ComplEx 等,用于将知识图谱中的实体和关系嵌入到低维向量空间中。 5. 其他类型: 图像 Embeddings:使用卷积神经网络(CNN)进行图像特征提取,得到的特征向量即为图像嵌入。 音频 Embeddings:在语音识别和声纹识别中,将声音信号转化为有意义的向量表示。 用户/物品 Embeddings:在推荐系统中,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐。 图 Embeddings:是用于学习图结构的表示学习方法,将图中的节点和边映射到低维向量空间中。通过学习图嵌入,可以将复杂的图结构转化为向量表示,以捕捉节点之间的结构和关联关系。这些方法可以通过 DeepWalk、Node2Vec、GraphSAGE 等算法来实现。图嵌入在图分析、社交网络分析、推荐系统等领域中广泛应用,用于发现社区结构、节点相似性、信息传播等图属性。 此外,以 OpenAI 为例,第一代嵌入模型(不推荐)包括: 所有第一代模型(以001 结尾的模型)都使用 GPT3 分词器,最大输入为 2046 个分词。 第一代嵌入由五个不同的模型系列生成,这些模型系列针对三个不同的任务进行了调整:文本搜索、文本相似性和代码搜索。 相似性嵌入:textsimilaritybabbage001、textsimilaritycurie001、textsimilaritydavinci001。 文本搜索嵌入:textsearchadaquery001、textsearchbabbagedoc001、textsearchbabbagequery001、textsearchcuriedoc001、textsearchcuriequery001、textsearchdavincidoc001、textsearchdavinciquery001。 代码搜索嵌入:codesearchadatext001、codesearchbabbagecode001、codesearchbabbagetext001。 对于001 文本嵌入(不是002,也不是代码嵌入),建议将输入中的换行符替换为单个空格,因为当存在换行符时可能会有更糟糕的结果。
2025-03-12
我想要制作一款小游戏,上架到抖音和微信,请你给我列举出需要用到的ai和软件
以下是制作小游戏并上架到抖音和微信可能需要用到的 AI 和软件: AI 方面:可以利用 AI 描述需求生成游戏代码,例如向云雀 3.5 等模型描述需求来辅助生成代码。还可以让 AI 处理图片、绘制角色形象等。 软件工具: 图像托管网站:用于上传游戏中的图片,选择无需登录、兼容性强的网站。 代码解释网站:有专门解释代码改游戏 bug 的网站,部分有免费额度。 GitHub:用于游戏发布,需要注册账号,设置游戏名,选择公共或锁定,上传文件等。 Zion:支持小程序、Web、AI 行为流全栈搭建,APP 端全栈搭建 2025 上线。 Coze:可作为后端服务。 微信开发者工具:用于微信小程序的开发。
2025-03-10
程序员在使用AI的时候会涉及哪些AI工具,帮我分别具体列举出来
程序员在使用 AI 时,可能会涉及以下一些 AI 工具: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,帮助提高编写代码的效率。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成等多种能力。 3. CodeWhisperer:亚马逊 AWS 团队推出的由机器学习技术驱动的代码生成器,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码。 5. Cody:代码搜索平台 Sourcegraph 推出的 AI 代码编写助手,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的智能研发服务的免费 AI 代码助手,基于蚂蚁集团自研的基础大模型进行微调。 7. Codeium:一个由 AI 驱动的编程助手工具,通过提供代码建议、重构提示和代码解释来帮助软件开发人员提高编程效率和准确性。 此外,还有一些其他相关的 AI 工具,如: 1. ChatAll:可以同时与多个 AI 机器人实时聊天的开源工具,支持多种主流 AI 聊天机器人。 2. AIProductsAllInOne:整理了一些 ChatGPT 以及 AI 相关的生产力工具。 3. Shell GPT:在命令行中集成了 ChatGPT,帮助快速编写 shell 命令、代码片段等。 4. 飞书 GPT:集成了飞书、GPT3.5、Dall·E、Whisper 等 API,支持多种功能。 5. ChatPDF:提取 PDF 文件内容并交给 ChatGPT 分析,实现一对一对话交流。 6. GitHub Copilot X:基于 AI 驱动的跨时代代码编辑器,带来全新编程体验。 在 PPT 制作方面,有以下 AI 工具: 1. MindShow 2. 爱设计 3. 闪击 4. Process ON 5. WPS AI 每个工具都有其特色和适用场景,程序员可以根据自己的需求选择最适合的工具。
2025-03-07
开发角色在使用AI的时候会涉及哪些AI工具,帮我分别具体列举出来
开发角色在使用 AI 时可能涉及以下工具: 1. 个性(LLM 的文本):一些开源模型如 Vicuna 和 Pygmalion 经过微调,可在特定个性到无审查的角色扮演等场景中表现出色。 2. 记忆(向量存储):像 Pinecone 这样的向量存储系统,用于存储长期记忆、背景故事等独特信息。 3. 语音(语音合成):ElevenLabs 产品可赋予声音,并控制年龄、性别和口音。 4. 外表(SD 模型作图):LoRAs 可精细控制图像风格、细节和设置。 5. 动画(视频动画):DID 和 HeyGen 等工具能使图像“说话”。 6. 平台:多数开发者在 GCP 和 AWS 上部署运行,Steamship 等解决方案也受关注。 7. UI 层:SillyTavern、Agnaistic 和 KoboldAI 等是受欢迎的前端界面选择。 在游戏开发方面: 1. Unity 提供了新 Copliot 工具,可通过与 Muse Chat 聊天快速启动创建游戏项目,协助编码,创建 3D 材质、动画等内容。 2. Unity Sentis 工具允许在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强玩法和功能,是跨平台解决方案。
2025-03-07
CRM会涉及哪些AI工具,帮我分类具体列举出来
以下是 CRM 可能涉及的 AI 工具分类列举: 销售相关工具: Salesforce 爱因斯坦:通过分析数据集识别潜在客户,生成潜在客户评分,具有自动化功能。 Clari:从事智能收入运营,能统一数据并创建准确的收入预测。 Hightime:销售团队的 AI 助手,处理重复性任务和耗时研究。 AIGC 在 CRM 中的应用: 个性化营销内容创作:根据客户数据生成个性化营销文案和视觉内容。 客户服务对话系统:开发智能客服系统,通过自然语言交互解答咨询和投诉。 产品推荐引擎:生成产品描述和展示内容,结合推荐算法推荐产品。 CRM 数据分析报告生成:自动生成数据分析报告,包括多种形式。 智能翻译和本地化:提供多语种翻译及本地化服务。 虚拟数字人和营销视频内容生成:快速生成相关形象和视频内容。 客户反馈分析:高效分析客户反馈信息。 产品经理相关 AI 工具: 用户研究、反馈分析:Kraftful(kraftful.com) 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 画原型:Uizard(uizard.io/autodesigner/) 项目管理:Taskade(taskade.com) 写邮件:Hypertype(hypertype.co) 会议信息:AskFred(fireflies.ai/apps) 团队知识库:Sense(senseapp.ai) 需求文档:WriteMyPRD(writemyprd.com) 敏捷开发助理:Standuply(standuply.com) 数据决策:Ellie AI(ellie.ai) 企业自动化:Moveworks(moveworks.com)
2025-03-07
CRM会涉及哪些AI工具,帮我分类具体列举出来
CRM 可能涉及的 AI 工具主要有以下几类: 与销售工作相关的 AI 工具: 1. Salesforce 爱因斯坦:能分析大量数据集识别潜在客户,生成预测性潜在客户评分,还能自动化执行日常或耗时任务。 2. Clari:专门从事智能收入运营,能统一数据并创建准确的收入预测。 3. Hightime:销售团队的 AI 助手,处理重复性任务和耗时研究。 AIGC 在 CRM 中的应用: 1. 个性化营销内容创作:根据客户数据生成个性化且富有创意的营销文案、视觉内容等。 2. 客户服务对话系统:开发智能客服系统,通过自然语言交互解答客户咨询、投诉等。 3. 产品推荐引擎:生成产品描述、视觉展示等内容,结合推荐算法为客户推荐产品。 4. CRM 数据分析报告生成:自动生成数据分析报告,包括文字、图表、视频演示等形式。 5. 智能翻译和本地化:提供高质量多语种翻译及本地化服务。 6. 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容。 7. 客户反馈分析:高效分析海量客户反馈文本和多媒体信息,挖掘客户需求和潜在痛点。 产品经理的 AI 工具集: 1. 用户研究、反馈分析:Kraftful(kraftful.com) 2. 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 3. 画原型:Uizard(uizard.io/autodesigner/) 4. 项目管理:Taskade(taskade.com) 5. 写邮件:Hypertype(hypertype.co) 6. 会议信息:AskFred(fireflies.ai/apps) 7. 团队知识库:Sense(senseapp.ai) 8. 需求文档:WriteMyPRD(writemyprd.com) 9. 敏捷开发助理:Standuply(standuply.com) 10. 数据决策:Ellie AI(ellie.ai) 11. 企业自动化:Moveworks(moveworks.com)
2025-03-07
国内做视觉理解的大模型厂商有哪些
国内做视觉理解的大模型厂商有以下这些: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com 上海: 商汤(日日新大模型):https://www.sensetime.com MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 此外,在 0 基础手搓 AI 拍立得的模型供应商选择中,还有以下视觉类大模型厂商: 智谱 GLM4V:通用视觉类大模型,拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,一个接口支持图片/视频/文本,视频和图片类型不能同时输入,调用成本为 0.05 元/千 tokens, 阿里云百炼 qwenvlplus:通用视觉类大模型,拍立得目前使用的模型,指令灵活性比较丰富,接口调用入门流程长一些,密钥安全性更高,调用成本为¥0.008/千 tokens,训练成本为¥0.03/千 tokens, 阶跃星辰:通用视觉类大模型,响应速度快,支持视频理解,输入成本为¥0.005~0.015/千 tokens,输出成本为¥0.02~0.07/千 tokens, 百度 PaddlePaddle:OCR,垂直小模型,文本识别能力补齐增强,私有化部署服务费,API 调用在¥0.05~0.1/次,
2024-12-19
WayToAGI是什么?是哪家厂商做的?
WaytoAGI 直译就是通往 AGI 之路,它是一个自组织的AI社区,发起人是 AJ 和轻侯。AGI 指通用人工智能。
2024-09-29
国内大模型厂商对比
以下是国内大模型厂商的相关情况: 8 月正式上线的国内大模型: 北京的五家企业机构: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海的三家企业机构: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat。 目前不能进行自然语言交流的:昇思(可以对文本进行是否由 AI 生成的检测,类似论文查重,准确度不错)。 受限制使用的:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值)。 特色功能:昇思——生图,MiniMax——语音合成。 中文大模型基准测评 2023 年度报告中的情况: 从大厂和创业公司的平均成绩来看,大厂与创业公司差值约 6.33 分,较 11 月份差距在增大,说明大厂在大模型竞争中长期资源投入方面有一定优势。 过去八个月国内模型在 SuperCLUE 基准上的前三名: 12 月:文心一言 4.0 11 月:文心一言 4.0 10 月:BlueLM 9 月:SenseChat3.0 通过 SuperCLUE 测评结果发现,国内大模型的第一梯队有了更多新的模型加入。头部模型如文心一言 4.0、通义千问 2.0 引领国内大模型的研发进度,部分高质量大模型紧追不舍,分别在闭源应用和开源生态中形成自己独特的优势。 从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。
2024-08-30
智谱跟其他厂商的差异和优势是什么
智谱与其他厂商的差异和优势主要体现在以下几个方面: 1. 模型研发:一年间推出了 4 代 GLM,一直是国内能力最好的模型之一。22 年就和清华一起自研了 GLM130B。 2. 技术来源:由清华大学计算机系技术成果转化而来,背后有清华大学研发团队的科研成果支持。 3. 产品设计:以 ChatGPT 为对标,努力打造类似的用户体验。 4. 智能体应用:是国内首批开放智能体应用的 AI 公司之一,在智能体开发和模型优化方面积累了丰富经验和技术。 5. 性能表现:在逻辑推理和处理复杂提示词方面表现出明显优势,在处理需要深度思考和分析的任务时表现出色。 6. 产品体系:合作研发了双语千亿级超大规模预训练模型 GLM130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎。基于此模型打造了 ChatGLM,还推出了认知大模型平台 Bigmodel.ai,包括 CodeGeeX 和 CogView 等产品,提供智能 API 服务。
2024-08-30
ai模型chatglm,百川大模型,通义千问,yi系列的模型厂商和团队背景,ai产品调用api的成本
以下是关于您提到的 AI 模型的厂商和团队背景以及 AI 产品调用 API 成本的相关信息: 厂商和团队背景: 通义千问:由阿里开发,接口可在 https://dashscope.console.aliyun.com/ 创建 API key。 智谱 AI(ChatGLM):由智谱 AI 开发,相关网址为 https://chatglm.cn 。 百川大模型:由百川智能开发,网址为 https://www.baichuanai.com/ 。 关于 AI 产品调用 API 的成本: 目前国内的大模型大多限制一定免费额度的 Token,各平台 API 调用计费是按计算 token 费率定价,具体收费标准不同,需自行留意对应官网。例如 GPT3.5、GPT4、文心一言、讯飞星火、通义千问、mimimax 等,收费标准不一,不做统一赘述。
2024-08-20
ai模型chatglm,百川大模型,通义千问,yi系列的模型厂商和团队背景,ai产品调用api的成本
以下是关于您提到的 AI 模型的厂商和团队背景以及 AI 产品调用 API 成本的相关信息: 厂商和团队背景: 通义千问:由阿里开发,接口可在 https://dashscope.console.aliyun.com/ 创建 API key。 智谱 AI(ChatGLM):由智谱 AI 开发,相关网址为 https://chatglm.cn 。 百川大模型:由百川智能开发,网址为 https://www.baichuanai.com/ 。 关于 AI 产品调用 API 的成本: 目前国内的大模型大多限制一定免费额度的 Token,各平台 API 调用计费是按计算 token 费率定价,具体收费标准不同,需自行留意对应官网。例如 GPT3.5、GPT4、文心一言、讯飞星火、通义千问、mimimax 等,收费标准不一,不做统一赘述。
2024-08-20