Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

为什么国内目前仍有一些人在盲目夸耀国产AI不错,有出息,等等

Answer

国内在 AI 领域的发展情况较为复杂。在 2023 年之前,国内 AI 行业曾自认为与美国差距不大且有人口数据优势,但 ChatGPT 和 GPT4 的出现打破了这种认知,直接拉开了 2 年的技术差距。上半年国内坚信靠资金和卡能发展,但试验后发现不易,下半年纷纷转向“垂直应用”“商业化”,不提 AGI,这种转向是短视且致命的。目前国内最领先的模型水平大概在准 ChatGPT3.5,与 GPT4 有差距。

国内大厂在人才、GPU、数据和资金储备上有冲击 AGI 的能力,但受内部短期考核压力等影响,实际效果不明显。具体来说,百度的“文心 4.0”和阿里的“通义千问”是比较突出的。同时,智谱一年间推出了 4 代 GLM,MiniMax 推出了新模型和“星野”APP,月之暗面在长 Token 能力上表现不错。

在图像 AI 领域,国内产品发展迅速,如快手团队开发的“可灵”能生成高质量图像和视频,但价格较高;阿里的“通义万相”在中文理解处理方面出色,操作界面友好,且目前免费,但存在一些局限性。

在硬件层,国内仍面临芯片卡脖子问题,目前没有能胜任大模型训练的芯片,在推理上虽有 Nvidia 的替代产品出现,但华为昇腾因稳定性和生态问题还需时间打磨。

Content generated by AI large model, please carefully verify (powered by aily)

References

AGI万字长文(上)| 2023回顾与反思

[title]AGI万字长文(上)| 2023回顾与反思[heading1]上篇:2023,风暴的前奏[heading2]<7>国内进展与卡脖子从业内人的角度,ChatGPT和GPT4的出现时最令人惊讶的,不是它的能力,而是保密工作做的太好。2023之前国内AI行业还处在沾沾自喜,自认为和美国只有个把月差距,而且还有人口数据优势;这种论调一下子被GPT4打回了原形。OpenAI在国内完全没有预警的情况下,直接拉开2年技术差距。具体原因,可能是国内的骄傲自大,可能是被之前Google主推的T5技术路线带偏,也可能是因为AGI实在是影响过于巨大,FBI、美国国防部这些国家机关不可能没和OpenAI打过招呼。OpenAI的成功是大力出奇迹,所以23年上半年国内也笃信只要有卡有钱就可以“大炼钢铁”。那时不论是纷纷囤卡招人,研究类GPT架构的大厂们,还是讲着中国OpenAI的故事,拿着巨额融资的创业公司们,都想要第一个创造国产AGI。而到了下半年,在试验了一番发现不容易之后,又纷纷转向要做“垂直应用”、“商业化”;反而不提AGI了。这个转向是短视的,甚至是致命的。2023年,中美在AGI技术的差距并没有缩小。现在,国内最领先的模型水平大概在准ChatGPT3.5的水平,和GPT4还有不小差距;甚至还不如临时拼凑的Mistral团队的水平。大厂。大厂们无论是人才、GPU、数据,还是资金储备都是可以冲击AGI的,不过从实际效果上来看还并没有明确亮点。但与此同时,受内部短期考核压力的裹挟,大多数力量应该都放在卷新产品圈地盘和向上汇报工作上了。从另一个角度,这些模型虽然能力一般,但和业务的结合都是比较充分的。最后,大厂们同时背负了太多其他业务和政治考量:对于是否做大模型的出头鸟,很多公司都是要三思的。具体来讲,百度和阿里是大厂里比较高调:百度的“文心4.0”是当前国内能力最好的模型之一,即将发布的阿里的“通义千问

给小白的AI产品推荐

首先介绍的是"可灵",这是一款由快手团队开发的AI应用。可灵主要用于生成高质量的图像和视频。它的一大特点是生成的图像质量非常高。可灵最初采用内测邀请制,但现在已经向所有用户开放使用。然而,可灵的价格相对较高。与其他AI应用相比,它的费用要贵一些。对于重度用户,最高档的年费可能达到几千元人民币,如果平均到每个月,使用成本在400到600元人民币之间。但如果临时使用或轻度使用的话,仍然有每日免费点数和60多元单月的最便宜包月选项,对轻度用户来说还是值得一试的。[heading3]3.1.2通义万相[content]通义万相作为国产AI工具,它在中文理解和处理方面表现出色,这一特点使其在国内市场具有独特优势。用户可以从多种艺术风格和图像风格中进行选择,满足不同创作需求。生成的图像质量较高,细节丰富,能够满足大多数用户的期望。操作界面设计简洁直观,用户友好度高,降低了使用门槛。作为阿里生态系统的一部分,该工具可以与阿里其他产品和服务无缝整合,为用户提供更全面的解决方案。重点是现在免费,每天签到获取灵感值就可以。然而,这个应用也存在一些局限性。为了符合国内监管要求,某些类型的图像可能无法生成,这在一定程度上限制了创作自由度。在处理非中文语言或国际化内容方面,它可能不如一些国际AI图像生成工具那样出色。由于模型训练数据可能主要基于中文环境,在处理多元文化内容时可能存在偏差。

AGI万字长文(上)| 2023回顾与反思

[title]AGI万字长文(上)| 2023回顾与反思[heading1]上篇:2023,风暴的前奏[heading2]<7>国内进展与卡脖子智谱:一年间推出了4代GLM,一直是国内能力最好的模型之一MiniMax:推出了MoE架构的新模型,和”星野“这个目前国内最成功的AI陪聊APP月之暗面:专注长Token能力,在记忆力和长Token能力上可圈可点其他的我暂时不列了,在2023年官宣AI大模型的公司非常多,其中免不了很多是蹭流量的。以及,大模型确实有门槛,融了资的公司还有些钱花,我们可以多给一些时间看2024年的结果。(判断的方式并不客观,欢迎讨论)从产品层面上,2C端唯一真正出圈的是“妙鸭相机”,不过也只是昙花一现。大多数消费者对于AI产品的态度是“猎奇”,而非刚需。在2B行业中,大模型目前还是“纯技术投入”,对于收入撬动非常有限;而卖AI的大厂们实际上的目的是为了卖云……最后,硬件层上的卡脖子并没有缓解。目前国内仍然没有芯片可以胜任大模型训练。不过在推理上已经开始有Nvidia的替代产品逐渐出现。备受瞩目的华为昇腾在单卡指标上距离不远,但因为稳定性不足和缺乏Cuda(硬件编译库)生态,仍然需要时间打磨。美国对于国内的芯片禁运在未来还会进一步加深;因此,除了卷模型之外,基于昇腾生态的软-硬件创业是一个机会,而且是更确定的机会。

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
国产ai中,哪个可以把平面产品图处理成3d产品视频
以下是一些国产 AI 可以将平面产品图处理成 3D 产品视频的相关信息: 即梦:在平面设计稿转 3D 这一环节,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片,经过多次生成并选择高清放大。 但需要注意的是,不同的 AI 在处理效果和适用场景上可能会有所差异,您可以根据具体需求进行选择和尝试。
2025-03-25
国产的ai工具有哪些
以下是一些国产的 AI 工具: 图像类: 可灵:由快手团队开发,可生成高质量的图像和视频,但价格相对较高,重度用户年费可达几千元,轻度用户有每日免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁,用户友好度高,目前免费,每天签到获取灵感值即可,但在某些方面存在局限性。 思维导图类: GitMind:免费跨平台,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内的思维导图+AIGC 工具,能利用 AI 生成思维导图。 AmyMind:轻量级在线工具,无需注册登录,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的助手,可一键拓展思路,生成文章大纲。 TreeMind:输入需求即可由 AI 自动完成思维导图生成。 EdrawMind:提供一系列 AI 工具,包括头脑风暴功能。 其他类: 传音智库:公司内部的 AI 平台,功能类似于 Poe,仅内网可访问,可用 kimi 替代。 Kimichat:https://kimi.moonshot.cn/ 秘塔 AI:https://metaso.cn/
2025-03-18
国产编码类AI
以下是一些国产的编码类 AI 产品: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,提高编程效率。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,具备行级/函数级实时续写、自然语言生成代码等多种能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费编程助手,基于 130 亿参数的预训练大模型,可提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手,基于自研基础大模型微调。 7. Codeium:由 AI 驱动的编程助手工具,通过提供代码建议等帮助软件开发人员提高效率和准确性。 此外,字节最新发布的 AI 编程工具 Trae 的 Windows 版也已发布,具有以下特点: 1. 全中文界面,跨平台支持,包括 Windows 和 MacOS 系统,操作界面简洁直观,易于上手。 2. 内置 Claude3.5 和 GPT4o 两大顶尖 AI 模型,完全免费且不限使用次数。 3. 零门槛智能开发,不懂编程也能通过中文对话让 AI 生成所需代码,并自动识别和解决代码错误。 字节的 Trae 目前处于公测阶段,完全免费。它同时支持豆包 1.5 Pro 和 Deepseek R1、V3 等模型。虽然在处理复杂业务时可能不如 Cursor,但为不懂技术的人提供了新选择,有望实现一人搞定业务、产品、设计、开发、运维等全流程。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。
2025-03-16
有关国产大模型介绍及对比
以下是关于国产大模型的介绍及对比: 过去一年,国内大模型取得了显著进步。综合能力超过 GPT 3.5 和 GeminiPro 的国产模型有 11 个,如百度的文心一言 4.0、阿里云的通义千问 2.0 和 Qwen 72BChat、OPPO 的 AndesGPT、清华&智谱 AI 的智谱清言、字节跳动的云雀大模型等。在 SuperCLUE 测评中,国外模型平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距约 4 分,且国内外平均水平差距在缩小。 国内开源模型在中文上表现优于国外开源模型,如百川智能的 Baichuan213BChat、阿里云的 Qwen72B、Yi34BChat 均优于 Llama213BChat。国内大模型竞争格局方面,从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。 此外,还有针对国产大模型的测评机制,包括以同组提示词下 ChatGPT 4.0 生成的内容做对标参照,对复杂提示词理解和执行、推理能力、文本生成能力、提示词设计能力、长文本归纳总结能力等方面进行多轮测评。 国外的代表性大模型如 GPT4 的不同版本、Claude2、Llama2 有较好的稳定性表现。国内开源模型总体表现较好,成绩最好的开源模型在中文某些场景或任务上接近 GPT 4,大版本的模型通常优于中小版本,众多创业公司是开源模型的主力。
2025-03-10
能够生成AI视频的免费国产软件有哪些?
以下是一些能够生成 AI 视频的免费国产软件: 1. Hidreamai:有免费额度,网址为 https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA:网址为 https://etna.7volcanoes.com/ 。这是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文和时空理解。 3. 可灵:网址为 https://klingai.kuaishou.com/ 。在 AI 视频生成领域表现出色,生成的视频质量高,生成速度快,对国内用户的可访问性强。支持文生视频、图生视频,提示词可使用中文,文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸。 4. Dreamina:处于国内内测阶段,有免费额度,网址为 https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频、视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以,文生视频支持多种控制和尺寸选择,默认生成 3s 的视频。
2025-03-08
国产AGI进程到哪了
2023 年之前,国内 AI 行业自认为和美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。上半年国内坚信靠资金和卡能实现“大炼钢铁”,许多大厂和创业公司都想创造国产 AGI,但下半年发现不容易后纷纷转向“垂直应用”“商业化”,不再提 AGI。目前国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。百度的“文心 4.0”和即将发布的阿里的“通义千问”是国内较好的模型。 2024 年,国内多家厂商竞相推出新型推理模型,AI 与数学结合被视为实现 AGI 的关键。在这一年,AI 音频能力有长足进展,“全真 AI 颜值网红”出现,游戏 AI NPC 有里程碑式进展,AI 男/女朋友聊天基本成熟,实时生成的内容开始在社交媒体和广告中出现,AI Agent 有明确进展,可穿戴全天候 AI 硬件层出不穷,华为昇腾生态开始形成,国内推理芯片开始国产替代。但同时,AI 造成的一些问题也开始进入公众视野,AI 立法、伦理讨论仍大规模落后于技术进展。预计到 2025 2027 年,AI 相关技术还会有更多突破和发展,同时也会带来更多社会问题。
2025-03-06