Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

阿里集团投资了哪几个大模型公司

Answer

阿里投资的大模型公司主要有月之暗面和 MiniMax 。

去年底,阿里开始密切接触当时大模型公司中排位相对靠后的月之暗面,并在 2024 年春节前谈定投资,大手笔投资近 8 亿美元,持股比例约 40%,月之暗面投后估值来到 23.4 亿美元。

此外,阿里在今年初投资了 MiniMax 约 6 亿美元。

Content generated by AI large model, please carefully verify (powered by aily)

References

中国大模型生存战:巨头围剿,创业难熬

共同造就如今创业公司过山车轨迹的,是同时酝酿于去年冬天的两种大厂策略。经历了2023年2月王慧文自掏5000万美元启动“光年之外”,到一批新公司涌现,再到光年之外突然被美团收购,AI大模型的融资水温本已由热转凉。一位去年跟踪了4家大模型公司的投资人,曾“辛辛苦苦要到了”六小龙中某一家的份额,而到下半年,他认为大模型已没有机会:“年初时我见这些founder,他们还说一年就能追上美国。到年底,大家发现钱不容易拿到,人也挖不来。”此时,阿里的激进投资,一举扭转了市场情绪。去年底,阿里开始密切接触当时大模型公司中排位相对靠后的月之暗面。当时经过两轮融资,估值来到8亿美元的月之暗面已寻求新融资数月。原本的交易方案不足为奇:以投前9亿美元获得约1亿美元融资,潜在领投方是小红书。如果成功,月之暗面会成为中国第5家估值超10亿美元的大模型独角兽。而年底入局的阿里却提出,将投前估值抬到15亿美元,小红书此后放弃了领投。这笔交易最终在2024年春节前谈定,阿里大手笔投资月之暗面近8亿美元,持股比例约40%,月之暗面投后估值来到23.4亿美元,与之前的第一,MiniMax相当。这符合阿里云的战略:做智能算力供应商。类似微软与OpenAI的组合,阿里用算力加现金,投资了一批大模型公司。也是在去年冬天,阿里开始接触MiniMax,并在今年初投资了约6亿美元。

中国大模型生存战:巨头围剿,创业难熬

据QuestMobile数据,今年9月,豆包App的30日留存率[1]达到34.5%,而Kimi智能助手和MiniMax的海螺AI都是约28%。一位月之暗面人士告诉我们,他们在9月逐一列出了豆包有,而Kimi没有的功能点,开始仔细分析去年还不被视为对手的豆包。大公司也在更强势地争取大模型API客户。AI儿童玩具公司Haivivi CEO李勇告诉我们,此前他们一直用MiniMax的语音模型,而当其产品在抖音热卖后,字节联系到他们,称可提供优惠价的豆包大模型API,还承诺升级抖音店铺。李勇说,现在Haivivi会同时调用MiniMax和豆包的语音模型。几乎投了所有头部大模型公司的阿里,也是创业公司的API和To B业务潜在对手。阿里是中国最积极做开源大模型的公司。到今年9月,其Qwen系列开源大模型的总下载量已超4000万次,衍生出了5万个大模型,仅次于Meta的Llama系列。这可能会让本想购买创业公司大模型API,或让创业公司定制模型的客户转而投向开源生态。我们了解到,去年为大客户定制一个大模型,最高订单额可达1000万元,而今年则快速降到了百万元级别,乃至更低。在更底层的模型研发上,字节也展现出“饱和”进攻的姿态。视频生成模型是一个缩影。据了解,月之暗面从去年10月就开始做视频模型,起步很早;而在去年四季度朱文佳的OKR中,尚看不到视频模型的相关描述。

中国大模型生存战:巨头围剿,创业难熬

阿里的出手,改变了创业公司的身位,带来了弹药,也带来了比钱和算力更莫测难求的势能。从今年2月8亿美元融资曝光,到3月Kimi获得300%的用户增速,发布200万上下文的长文本新功能,今年上半年,月之暗面一直处于口碑与影响力的上升通道。被刺激起FOMO(害怕错过)情绪的投资机构,也继续贡献着融资。阿里之后,又有源码、高榕等机构投了月之暗面。当日历翻过年中,小阳春里的热情很快被巨头的阴影所笼罩。而字节快速包抄的种子,也萌芽于去年冬天。当时,一位投资人像往常那样循着AI论文去拜访作者,他惊讶地发现:不少人刚和字节创始人张一鸣一对一聊过,这其中还有尚未毕业的博士生。他马上和自己投资的一位大模型创始人说:“这是个危险的信号。”“这说明字节变了。”这位投资人认为,那之前,字节的大模型研发主要由朱文佳、李航(AI lab负责人)等人负责,“他们的精力分配,他们能不能跟上最前沿的技术,都让人怀疑。”危险的信号在今年逐渐变成危险的事实。字节的AI技术骨干持续增加,包括今年2月加入的Google原VideoPoet项目负责人蒋路,8月加入的零一万物黄文灏,和阿里通义大模型原技术负责人周畅。一位接近此事的人士说,当黄文灏提出离职,称要“奔赴AGI梦想”,并讲了字节开的条件时,“他们都不好意思挽留。”几位之前就认识周畅,听说他离职后想创业的投资人也告诉我们,当时“根本约不上”“发消息不回”。

Others are asking
AI的应用要经历哪几个阶段
AI 的应用通常要经历以下几个阶段: 1. 聊天机器人阶段:这是 AI 应用的初始阶段,主要实现简单的对话功能。 2. 推理系统阶段:能够进行一定的逻辑推理和分析。 3. 智能体阶段:构建具备自主思考、决策和执行能力的智能体。 4. 创新者阶段:在某些领域展现出创新能力。 5. 完整组织阶段:形成完整的、综合性的组织形式,发挥更强大的作用。
2025-03-06
那请帮我列举Ai下有哪几个子领域(他们必须是并列关系),机器学习下又有哪几个子领域
以下是 AI 的子领域: 1. 机器学习 2. 计算机视觉 3. 自然语言处理 4. 语音识别 5. 智能机器人 机器学习的子领域包括: 1. 监督学习,常用算法如线性回归、决策树、支持向量机(SVM)。 2. 无监督学习,如聚类、降维等算法。 3. 强化学习
2025-01-21
那请帮我列举Ai下有哪几个子领域,机器学习下又有哪几个子领域
AI 包含以下几个子领域: 1. 机器学习:让计算机通过数据学习来提高性能。 2. 深度学习:模拟人脑工作方式,创建人工神经网络处理数据。 3. 自然语言处理:涉及对自然语言的认知、理解和生成。 机器学习包含以下几个子领域: 1. 监督学习:通过有标记的训练数据进行学习和预测。 2. 无监督学习:在无标记的数据中发现模式和结构。 3. 强化学习:通过与环境交互并根据奖励信号来学习最优策略。
2025-01-21
学习AI可以从哪几个方面去学习
学习 AI 可以从以下几个方面入手: 1. 编程语言:从 Python、JavaScript 等编程语言开始学习,掌握编程语法、数据结构、算法等基础知识。 2. 工具和平台:使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 基础知识: 了解 AI 的基本概念、发展历程、主要技术(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注前沿动态:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考其对未来社会的影响。 对于新手学习 AI: 1. 了解 AI 基本概念: 阅读相关入门文章,熟悉术语和基础概念。 了解人工智能的主要分支及它们之间的联系。 2. 开始学习之旅: 参考为初学者设计的课程,如李宏毅老师的课程。 通过在线教育平台按自己节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习: 根据自身兴趣选择特定模块,如图像、音乐、视频等。 掌握提示词技巧。 4. 实践和尝试: 理论学习后进行实践,巩固知识。 分享实践成果。 5. 体验 AI 产品: 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 如果希望继续精进,对于不会代码的人,可以尝试了解以下基础内容: 1. AI 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及其关系。 历史发展:回顾 AI 的发展历程和重要里程碑。 2. 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等基本概念。 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:了解基本概念。 4. 评估和调优: 性能评估:掌握如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习使用网格搜索等技术优化模型参数。 5. 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。
2024-12-25
哪几个AI工具擅长网站前端网页设计?
以下是一些擅长网站前端网页设计的 AI 工具: 1. Wix ADI(Artificial Design Intelligence) 网址:https://www.wix.com/ 特点:基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 2. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA(Artificial Intelligence Design Assistant)通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 3. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是 Firedrop 的 AI 设计助手,可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 4. The Grid 网址:https://thegrid.io/ 特点:Molly 是 The Grid 的 AI 设计助手,可自动调整网站的设计和布局,基于内容和用户互动进行优化,支持多种内容类型。 5. Zyro 网址:https://zyro.com/ 特点:使用 AI 生成网站内容,包括文本、图像和布局建议,提供 AI 驱动的品牌和标志生成器,包含 SEO 和营销工具。 6. 10Web 网址:https://10web.io/ 特点:基于 AI 的 WordPress 网站构建工具,可自动生成网站布局和设计,提供一键迁移功能,集成了 AI 驱动的 SEO 分析和优化工具。 7. Jimdo Dolphin 网址:https://www.jimdo.com/ 特点:Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题定制网站,提供自动生成的内容和图像,包含电子商务功能。 8. Site123 网址:https://www.site123.com/ 特点:简单易用,适合初学者,提供多种设计模板和布局,包括内置的 SEO 和分析工具。 此外,以下是一些推荐的网页原型图生成工具: 1. 即时设计:https://js.design/ 一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix:https://wix.com/ Wix 是一款用户友好的 AI 工具,可在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。但内容由 AI 大模型生成,请仔细甄别。
2024-10-31
阿里巴巴开发的AI有哪几个
阿里巴巴开发的 AI 包括以下几个: 1. 通义灵码:一款基于通义大模型的智能编程辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力。 2. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手,该产品是基于蚂蚁集团自研的基础大模型进行微调的代码大模型。 此外,在其他领域,阿里巴巴和蚂蚁集团也有相关的 AIGC 实践,例如: 电商设计师视角下的 AI 解读与应用 AI 引领,畅想未来办公的无限可能 当 AI 成为大众的新朋友 AI 新形态,数字人带你探索未来生活体验升级 让 AI 模型更加平易近人|ModelScope 模型开源社区设计实践 S03E05:当设计遇见 AI,智能设计的践行者——2022 阿里云设计中心年鉴 一览无遗,让收银更快捷支付宝智能 AI 秤 玩转 AI,探索绘图新世界 在编程辅助方面,还有其他一些常见的 AI 工具,如 GitHub Copilot(由 GitHub 联合 OpenAI 和微软 Azure 团队推出)、CodeWhisperer(亚马逊 AWS 团队推出)、CodeGeeX(智谱 AI 推出)、Cody(代码搜索平台 Sourcegraph 推出)、Codeium 等。每个工具的功能和适用场景可能会有所不同,您可以根据自己的需求来选择最适合您的工具。 如果您想使用 AI 完成阿里巴巴营销技巧和产品页面优化,可以采取以下步骤: 1. 市场分析:利用 AI 分析工具来研究市场趋势、消费者行为和竞争对手情况。 2. 关键词优化:AI 可以分析和推荐高流量、高转化的关键词,帮助卖家优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:AI 设计工具可以根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:AI 文案工具可以撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:AI 图像识别技术可以帮助选择或生成高质量的产品图片,这些图片能够更好地吸引顾客并展示产品特点。 6. 价格策略:AI 可以分析不同价格点对销量的影响,帮助卖家制定有竞争力的价格策略。 7. 客户反馈分析:AI 可以分析客户评价和反馈,帮助卖家了解客户需求,优化产品和服务。 8. 个性化推荐:AI 可以根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:AI 驱动的聊天机器人可以提供 24/7 的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:AI 可以分析不同营销活动的效果,帮助卖家了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:AI 可以帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:AI 可以分析不同的支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:AI 可以帮助卖家在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:AI 可以分析观众行为,帮助卖家优化直播和视频内容,提高观众参与度和转化率。
2024-10-20
了解学习阿里云百炼
阿里云百炼是基于通义系列大模型和开源大模型打造的一站式大模型服务平台,具有以下特点和优势: 提供「生成式大模型的应用编排搭建能力」和「企业大模型的全链路训练部署能力」,是企业 AI 时代的首选。 核心能力和优势: 大模型 API 服务:高可用、高性能、高性价比,提供通义闭源和开源系列大模型,以及图片、语音等多模态大模型和国内优质三方大语言模型。 AI 应用搭建:可观测、可干预、可追踪,提供 RAG 智能体应用、工作流编排和智能体编排三类使用场景的应用构建能力,以及包含插件能力、运营工具箱等适配工具,实现 10 分钟拖拉拽快速搭建 AI Agent。 同时提供很多行业级的解决方案,如短剧剧本创作、企业线索挖掘、泛企业 VOC 挖掘等。 其能力以原子级别的能力出售,即 API 能力,可结合日常场景进行二次加工应用。 体验相关: 百炼大模型平台体验入口:https://bailian.console.aliyun.com//home (需要登陆阿里云账号,也可以使用支付宝、钉钉、手机号快速注册登陆)。 建议注册后先进行实名认证,方便后续的一系列体验工作,以及领取一些免费的学习云资源。 此外,还有以下相关内容: 第一期「AI 实训营」手把手学 AI 中,本期共学直播地址:会议时间为 20:00 21:30 。 「第一天」COW 项目中,此教程是为 COW 项目接入千问、百炼而作,使用此教程的前提是已完成 COW 机器人的搭建,或者准备进行搭建。百炼首页:https://bailian.console.aliyun.com/ 。在调用阿里云的 AI 服务时有两种方式,一是直接调用模型,如通义千问系列以及其他的大模型产品服务。
2025-04-14
阿里的千问大模型在行业内处于一个什么样的水平
阿里的通义千问大模型在行业内处于领先水平。 通义千问 2.5 正式发布并开源 1100 亿参数模型,在多模态和专有能力模型方面影响力强大,始终坚持开源路线,已推出多款开源模型,受到开发者和生态伙伴的热情支持。百炼平台也升级支持企业 RAG 链路,提供更灵活的企业级检索增强服务。通义灵码推出企业版,满足企业定制化需求,已在多个领域落地应用。 Qwen2.5Max 基于 SFT 和 RLHF 策略训练,在多项基准如 Arena Hard、LiveBench、LiveCodeBench、GPQADiamond 上超越 DeepSeek V3,引发社区关注。支持官方 Chat、API 接口、Hugging Face Demo 等多种方式,展示其顶尖性能与灵活应用场景。 Qwen2.5VL 是新一代视觉语言模型,可解析 1 小时以上视频内容并秒级定位事件,识别从金融文档到通用物体,动态适配高分辨率图像。具备复杂任务执行能力,覆盖更多实际场景如票据解析、商业分析等。 10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0,8 大行业模型同步上线。
2025-03-14
阿里巴巴详情页生成
使用 AI 完成阿里巴巴营销技巧和产品页面优化,可以参考以下步骤: 1. 市场分析:借助 AI 分析工具研究市场趋势、消费者行为及竞争对手情况,快速获取产品受欢迎程度、价格区间、销量等关键信息。 2. 关键词优化:利用 AI 分析并推荐高流量、高转化的关键词,优化产品标题和描述,提升搜索排名与可见度。 3. 产品页面设计:通过 AI 设计工具,依照市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:运用 AI 文案工具创作有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:依靠 AI 图像识别技术选择或生成高质量产品图片,更好地吸引顾客并展示产品特点。 6. 价格策略:让 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:借助 AI 分析客户评价和反馈,了解客户需求,优化产品和服务。 8. 个性化推荐:利用 AI 根据用户购买历史和偏好提供个性化产品推荐,增加销售额。 9. 聊天机器人:采用 AI 驱动的聊天机器人提供 24/7 客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:依靠 AI 分析不同营销活动效果,了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:使用 AI 帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:通过 AI 分析不同支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:利用 AI 帮助卖家在社交媒体上找到目标客户群体,进行精准营销提高品牌知名度。 14. 直播和视频营销:借助 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。
2025-03-11
如何使用阿里PAI部署大模型
以下是使用阿里 PAI 部署大模型的步骤: 1. 模型部署: 选中模型卡片,出现部署按钮。 选择 vLLM 部署。 小插曲:竞价系统(用更便宜的价格部署模型)。 部署完成后在 EAS 服务中可以找到 API 的 endpoint 和 key 信息。 同样在 EAS 服务中可以查看部署情况和日志,如果竞价获得不了资源,可以适当调整价格。 在 EAS 服务中可以直接尝试试用模型。 调试方法:Get models 方法需要用 vllm 框架部署才能支持;chat 方法,比如 7b 的蒸馏模型就换成相应的设置。 尝试部署一个 qwen2.5 7b instruct 的原生模型,并测试问题“9.11 和 9.9 的大小?” 2. 蒸馏>数据: 在本地的 python 环境中或 notebook gallery 里建立一个实例来执行 python。 执行相关代码,最终会获得一个 json 文件,即蒸馏出来的数据集。通常需要检查数据的正确性,再进行下一步的训练微调过程。 3. 作业: 在阿里云 PAI 平台上部署一个模型,并调试验证确认自己的部署成功。 调试信息中修改 content 的内容,必须在 content 内容中带上自己的钉钉“昵称”来向大模型对话。 在截止时间 2025/03/05 之前,将自己调试成功的效果截图(截图中的“content”内必须带着自己的钉钉),提交到「问卷地址」。 4. 模型蒸馏微调: 由于上一步中蒸馏的数据集很小,不足以改变模型权重,因此使用一个别人做好的数据集。在使用前可以打开看下里面的结构,和蒸馏出来的数据结构一致。 建立用于训练的数据集:下载并解压数据集,然后在 PAI 平台的数据集中找到 OSS 存储,建立数据集,然后上传数据集。 开始部署模型进行训练:选择 7b instruct 的原生模型,选择训练。选择全参微调,并选择自定义数据集。注意超参配置。 训练要求需要使用灵骏的资源,比如 8 卡 H100,需要的显存比较大。点击训练,在 DLC 里看到相应状态就是训练成功。 训练完成就可以测试模型效果:在 model gallery 里面找到训练好的模型,点击右上角的部署,使用 vllm 部署。部署完成后,使用相应命令调试。
2025-03-04
市面上还有阿里百炼平台类似的竞品吗? 我的意思是工作流
市面上与阿里百炼平台类似的工作流竞品有以下几种: 1. 智谱 GLM4V:通用视觉类大模型,拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,一个接口支持图片/视频/文本,视频和图片类型不能同时输入,调用成本为 0.05 元/千 tokens,可参考。 2. 阶跃星辰:通用视觉类大模型,响应速度快,支持视频理解,输入成本为 0.005~0.015/千 tokens,输出成本为 0.02~0.07/千 tokens,可参考。 3. 百度 PaddlePaddle:OCR 垂直小模型,文本识别能力补齐增强,私有化部署服务费,API 调用在 0.05~0.1/次,开源地址为。
2025-02-21
市面上还有阿里百炼平台类似的竞品吗?
目前市面上与阿里百炼平台类似的竞品有: 1. 智谱的 GLM4V:通用视觉类大模型,拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,一个接口支持图片/视频/文本,视频和图片类型不能同时输入,调用成本为 0.05 元/千 tokens。 2. 阶跃星辰:通用视觉类大模型,响应速度快,支持视频理解,输入成本为 0.005~0.015/千 tokens,输出成本为 0.02~0.07/千 tokens。 3. 百度 PaddlePaddle:OCR 垂直小模型,文本识别能力补齐增强,采用私有化部署服务费,API 调用在 0.05~0.1/次。
2025-02-21
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
如何在大集团里展开ai分享讨论会
以下是在大集团里展开 AI 分享讨论会的一些参考: 1. 杭州站 AI+X World Tour: AI 主题分享会:每人限时分享,主题是 2023 年 AI 对我的影响和挑战,2024 年的目标和计划。时间为 1 月 14 日周天 10am 12pm,地点在明月楼,筹备负责人为 Host: AJ + Evan,专场海报、报名表、Host 摄影等物料筹备。 AI 圆桌分享会:一起讨论下你想做的产品以及如何寻找 PMF。时间为 1 月 14 日周天 1pm 5pm,地点在明月楼,筹备负责人为 Host: AJ + Evan。 AI 画展:上面 workshop 的成果展示,时间为 1 月 14 日周天 1 月 21 日(一周时间)暂定,地点在明月楼,筹备负责人为 Host: 征集中。 2. AITalk 汗青的分享 2024 年 5 月 6 日:会议讨论了 AI talk 节目及相关技术的发展和应用,主要内容包括汗青分享视频制作经验、团队 AI talk 项目、对 AI 的看法等,强调创作本身、工具使用及商业回报的重要性,talk 实验及 AI 在影视创作中的应用,AI 在内容创作和传播中的影响,AI 在创作领域的应用和影响,AI 变现、内容付费、参赛、团队规模等问题,agent 在 C 端的商业化及与 carry 点 AI 的区别。汗青推荐了两本书,分别是尼尔·波兹曼的《娱乐至死》和约翰·伯格的书《观看的视界》(中文版又译作《讲故事的人》),还有推荐播客:一天世界:https://www.xiaoyuzhoufm.com/podcast/5e280fb1418a84a0461fc892?s=eyJ1IjogIjYyZmQxMzE4ZWRjZTY3MTA0YTU1ZTk4OSJ9 。待办事项包括 AJ 分享直播录屏,并发送 characterAI 的链接给大家;大聪明讲解对 agent 的理解,以及 agent 的前世今生@?AJ 。 3. 3 月 26 日|自由讨论|离谱视频切磋大会:会议主要讨论了人工智能(AI)在视频制作中的应用,与会成员分享了自己在不同领域的经验和对 AI 的学习和应用,探讨了如何通过实践项目学习和掌握人工智能工具和技能,以及 AIGC 的应用和学习。还讨论了 AI 视频制作的相关内容,包括如何组队参与比赛和商单,以及 AI 在视频制作中的应用。最后,还讨论了 4 月份比赛的相关事宜,包括比赛规则和参赛队伍的组建。同时,会议还提到了大家可以通过兴趣感来学习和成长,同时也可以在工作中应用。待办事项包括西琦把北京同学组队的二维码收集到一起@?AJ ;西琦找案例并一起分析@?AJ ;淅吾找新疆的朋友商量加入谁;毛叔拉群并制作基础的工具;西琦在 8 点到 8 点半的时间开始分享@?AJ 。
2025-01-06
从集团标准化管理、应用赋能、运营定位、迭代提升四个方面展开阐述人工智能赋能连锁药店运营管理的核心竞争力
很抱歉,目前知识库中没有关于从集团标准化管理、应用赋能、运营定位、迭代提升四个方面阐述人工智能赋能连锁药店运营管理核心竞争力的相关内容。但我可以为您提供一个大致的框架思路供您参考: 集团标准化管理方面: 利用人工智能制定统一的药品分类、库存管理和服务流程标准,确保各连锁药店的运营一致性和规范性。 通过智能数据分析,监测各门店对标准的执行情况,及时发现并纠正偏差。 应用赋能方面: 借助人工智能的图像识别技术,实现药品的快速准确盘点和库存监控。 利用智能客服系统,为顾客提供 24 小时不间断的咨询服务,提高服务效率和质量。 运营定位方面: 基于大数据和人工智能算法,分析不同地区、不同消费群体的需求特点,为各连锁药店精准定位目标市场和商品品类。 运用智能营销工具,实现个性化的促销活动推送,提高营销效果和顾客满意度。 迭代提升方面: 利用人工智能收集和分析顾客反馈、市场变化等数据,持续优化运营策略和服务模式。 建立基于人工智能的预测模型,提前洞察市场趋势和顾客需求变化,为连锁药店的发展提供前瞻性指导。 希望以上内容对您有所帮助,您可以根据实际情况进一步细化和完善。
2024-12-24