Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

今天的AI新闻

Answer

以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总:

3 月 4 日:

  • 【AI 3D】
    • Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。
    • InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。
    • 3D-Mem:新型 3D 场景记忆框架。
  • 【AI 绘图】
    • 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。
    • 海螺:推出 Image-01 多功能文本转图像模型。
  • 【AI 视频】
    • Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。
    • Vidu:API 开放平台全面开放。
  • 【AI 模型】
    • Google Colab:推出 Data Science Agent。
    • 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。
    • Opera:宣布推出网页浏览器的 AI 代理。

3 月 12 日:

  • 【AI 3D】
    • BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。
    • MIDI:单幅图像到 3D 场景生成。
    • Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。
  • 【AI 写作】
    • MM-StoryAgent:AI 多模态故事生成系统。
  • 【AI 视频】
    • VACE:阿里推出一体化视频创作和编辑技术。
    • VideoPainter:腾讯开源视频编辑技术。
    • Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。
  • 【其他】
    • OpenAI:为开发者推出一套 AI Agent 开发套件。
    • R1-Omni:阿里情感识别模型,通过视频识别情感。
    • Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。
    • Manus:宣布与阿里通义千问团队达成战略合作。

3 月 14 日:

  • 【AI 模型及其他】
    • 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。
    • OpenAI:4 项更新。
    • Bolt:一键将 Figma 设计转换为可运行的 Web 应用。
    • 阿里:推出 AI 旗舰应用“新夸克”。
    • 360 智脑团队:开源推理模型 Light-R1-14B-DS,复现 Deepseek 的强化学习效果。
  • 【AI 视频】
    • Pika:更新 Pikaffects,新增多款变身特效。
    • Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。
    • Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。
  • 【AI 绘图】
    • LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。
  • 【AI 语音】
    • Sesame:开源 TTS 语音模型 CSM-1B。
Content generated by AI large model, please carefully verify (powered by aily)

References

3月4日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月4日AI资讯[content]【AI 3D】Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的3D发丝InsTaG:通过几秒钟视频学习,快速形成逼真的3D说话头像效果3D-Mem:新型3D场景记忆框架【AI绘图】智谱:开源AI绘图CogView4,可以在图像中生成中文字符海螺:推出Image-01多功能文本转图像模型【AI视频】Runway:网友爆料Runway内测能力可根据参考图像进行Video to Video视频风格化Vidu:API开放平台全面开放【AI模型】Google Colab:推出Data Science Agent微软:为医疗行业提供首个统一语音AI助手:Dragon CopilotOpera:宣布推出网页浏览器的AI代理

3月12日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP:与Claude AI沟通,在blender实现快速3D建模MIDI:单幅图像到3D场景生成Move AI:更新动作捕捉能力,提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent:AI多模态故事生成系统【AI视频】VACE:阿里推出一体化视频创作和编辑技术VideoPainter:腾讯开源视频编辑技术Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能【其他】OpenAI:为开发者推出一套AI Agent开发套件R1-Omni:阿里情感识别模型,通过视频识别情感Luma AI:发布一种新的预训练范式IMM,旨在突破算法瓶颈,提高生成预训练算法的性能Manus:宣布与阿里通义千问团队达成战略合作

3月14日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月14日AI资讯【AI模型及其他】谷歌:Gemini应用能力升级,包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI:4项更新Bolt:一键将Figma设计转换为可运行的Web应用阿里:推出AI旗舰应用“新夸克”360智脑团队:开源推理模型Light-R1-14B-DS,复现Deepseek的强化学习效果【AI视频】Pika:更新Pikaffects,新增多款变身特效Freepik与Fal平台:引入Topaz AI的提升“FPS和视频分辨率”能力Krea:上线Veo 2模型,支持图生视频功能,但生成成本较高【AI绘图】LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame:开源TTS语音模型CSM-1B,

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
运用ai,生成每日自动推送到飞书消息的 公司文化日报,包含日历 天气 新闻 内部规划 事项
要运用 AI 生成每日自动推送到飞书消息的公司文化日报,包含日历、天气、新闻、内部规划和事项,您可以考虑以下步骤: 首先,需要确定获取日历、天气、新闻、内部规划和事项等信息的数据源。对于日历,可以使用在线日历服务的 API 来获取相关数据;天气信息可以从专业的气象数据提供商获取;新闻可以通过新闻聚合 API 或者与特定的新闻机构合作获取;内部规划和事项则需要从公司内部的管理系统或数据库中提取。 然后,选择适合的 AI 技术和工具。例如,可以使用自然语言处理技术来对获取到的数据进行处理和整合,生成易于阅读和理解的文本内容。 在生成日报的过程中,要注意格式的规范和统一,使其具有良好的可读性。同时,可以根据公司的文化特点和需求,对内容进行个性化的定制和优化。 另外,为了确保推送的准确性和及时性,需要建立有效的监控和反馈机制,及时发现并解决可能出现的问题。 希望以上建议对您有所帮助。
2025-04-14
2025年3月27日AI新闻
以下是 2025 年 3 月 27 日的部分 AI 新闻: 《详解 MCP:Agentic AI 中间层最优解,AI 应用的标准化革命》:Anthropic 推出的开放协议 MCP 迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口。它简化了开发者与数据源的整合,促进了生态形成,可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《对谈|如何用 AI 增强人类学习》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调输出能迫使知识内化。两位终身学习者分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。 《硅谷知名风投 BVP 专栏:消费级 AI 的临界点将至!》:消费级 AI 正迎来临界点,推动一波又一波的变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司不断涌现。未来,AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。 此外,2 月 27 日的相关新闻有:小红书 AI 赛道从 0 到 1 做 IP 的相关活动预告、工具分享及日更群计划。3 月 5 日的新闻包括:2025 开年 3 个月 AI 已经狂飙,更新密集发布;Grok 语音模式全面开放,支持 11 种模式(包括 2 种 18 禁),自带语音字幕,目前仅支持英文。
2025-03-27
3月27日,AI圈有哪些新闻
以下是 3 月 27 日 AI 圈的部分新闻: 《详解 MCP:Agentic AI 中间层最优解,AI 应用的标准化革命》:Anthropic 推出的开放协议 MCP 迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口,简化了开发者与数据源的整合,促进了生态形成,可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《对谈|如何用 AI 增强人类学习》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调输出能迫使知识内化,分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。 《硅谷知名风投 BVP 专栏:消费级 AI 的临界点将至!》:消费级 AI 正迎来临界点,推动变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司涌现,未来 AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。 此外,还有以下商业和技术方面的新闻: AI 商业爆发年:可灵 AI 营收破亿元,AIGC 营销素材日均消耗超 3000 万元。快手将 AI 作为生态重塑核心,引领视频生成模型全球竞速。可灵 AI 技术领先 Sora,获马斯克、MIT 科技评论等国际认可。 小白福音 Trickle:一键部署、无需 API,能直接克隆 Claude 聊天体验。面向非开发者,帮助快速从创意→上线,打通完整产品流程。模板丰富,涵盖问卷、小游戏、互动课程等多种场景。 拓竹 H2D 多才多艺:精度提升一个数量级,打印成品可直接使用。集成 3D 打印、激光雕刻、刀切、彩绘,支持双头多色打印。搭载视觉摄像头和神经算法,实现微米级精度。
2025-03-27
3月26日至今AI圈有哪些新闻
以下是 3 月 26 日至今 AI 圈的部分新闻: 3 月 26 日: 【AI 模型及应用】OpenAI 推出 GPT4o 图像生成能力;谷歌发布 Gemini 2.5 Pro Experimental 模型;Trea 已内置 DeepSeekV30324。 【AI 音乐】昆仑万维发布全球首款音乐推理大模型 Mureka O1。 【AI 视频】混元 Portrait 实现音频视频驱动图片肖像形成动画;PPVCtrl 推出新可控制视频生成模型。 【AI 3D】Vibe Draw 可通过草图进行 3D 建模;PhysTwin 通过视频创建交互式物理数字孪生;GroomLight 用于重打光的人体头发外观建模的混合逆向渲染。 3 月 27 日: 《》:MCP(Model Context Protocol)是由 Anthropic 推出的开放协议,迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口。它简化了开发者与数据源的整合,让 AI 应用无缝连接各种工具和服务。MCP 不仅促进了生态的形成,甚至可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调“输出能迫使知识内化”。两位终身学习者分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。“真正的深度与灵感,源于人类富有情境的问题。” 《》:消费级 AI 正迎来临界点,推动一波又一波的变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司如雨后春笋般涌现。未来,AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。正如报告所言:“AI 的进步既是开创新产品的源动力,也是消费巨头崛起的分销载体。” 3 月 26 日: AI 商业爆发年:可灵 AI 营收破亿元,AIGC 营销素材日均消耗超 3000 万元。快手将 AI 作为生态重塑核心,引领视频生成模型全球竞速。可灵 AI 技术领先 Sora,获马斯克、MIT 科技评论等国际认可。 小白福音 Trickle:一键部署、无需 API,能直接克隆 Claude 聊天体验。面向非开发者,帮助快速从创意→上线,打通完整产品流程。模板丰富,涵盖问卷、小游戏、互动课程等多种场景。 拓竹 H2D 多才多艺:精度提升一个数量级,打印成品可直接使用。集成 3D 打印、激光雕刻、刀切、彩绘,支持双头多色打印。搭载视觉摄像头和神经算法,实现微米级精度。 Figure 人形机器人新突破。
2025-03-27
最近的AI新闻
以下是近期的 AI 新闻汇总: 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 Blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。 3 月 26 日: 【AI 模型及应用】 OpenAI:推出 GPT4o 图像生成能力。 谷歌:发布 Gemini 2.5 Pro Experimental 模型。 Trea:已内置 DeepSeekV30324。 【AI 音乐】 昆仑万维:发布全球首款音乐推理大模型 Mureka O1。 【AI 视频】 混元 Portrait:音频视频驱动图片肖像形成动画。 PPVCtrl:新可控制视频生成模型。 【AI 3D】 Vibe Draw: 草图进行 3D 建模。 PhysTwin:通过视频创建交互式物理数字孪生。 GroomLight:用于重打光的人体头发外观建模的混合逆向渲染。
2025-03-26
如何订阅最新的ai新闻
以下是一些订阅最新 AI 新闻的途径: 公众号: “超时空视角”:提供 AI 资讯。 猫叔个人公众号“AI 替代人类”。 “歸藏的 AI 工具箱”:有 AI 课程撰写与信息收集整理,适合 AI 从业人员或想加入该领域工作的人,免费订阅可获得日常内容更新,付费会员可获得更多服务,如记录上周值得关注的 AI 领域主要发布、核心从业者需要关注的 AI 动态、涉及各个 AI 领域的优质内容、过去一周最重要的研究论文和简短解读介绍,还能加入核心粉丝群获得最及时的 AI 资讯通知和优先工作撮合机会。 小红书/抖音:“EverAI”。 B 站:“Ever AI 酱”,这里会有教程及 AI 工具界面操作。
2025-03-24
AI的昨天、今天和明天
AI 的发展历程可以从以下几个方面来阐述: 昨天: 在过去,AI 的研究和发展处于相对初级的阶段,技术和应用都较为有限。 今天: 1. AI 艺术方面,Prompting 成为驱动因素,创造了多维感官和令人印象深刻的记忆,改变了人们对艺术创作和表达的认知。 2. OpenAI CEO Sam Altman 发表的文章指出,AI 智能水平与计算资源呈对数关系,成本每年下降 10 倍,智能增长带来超指数级经济价值,AI 代理将颠覆知识型工作。 3. 如斯坦福的 2025 年 AI 指数报告所示,AI 在硬件、推理成本估计、出版和专利趋势等方面有了新的分析和发展,在企业责任实践、科学和医学领域的作用不断扩大。 明天: 1. AGI(通用人工智能)的影响力可能会扩散,但不均衡,科学研究可能率先受益。 2. 社会需要适应 AI 带来的变革,如工作方式、经济体系等方面的改变。 3. 人们可能会通过 AI 分享记忆,一个人的体验可能被全人类所感受。 总之,AI 的发展迅速且影响深远,未来充满了机遇和挑战。
2025-04-14
今天是2025-3-20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 14 日至 20 日)的 AI 相关新闻: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 本文介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 AI 切磋大会第 11 期报名开启!3 月 30 日,主题是“2 小时,让 AI 将你的创意变为现实”。无论你是编程小白还是高手,欢迎来现场展示你们的案例。 Yourware 是一款强大的工具,让普通用户轻松创建和部署 AI 编程作品集。只需复制代码,即可一键部署网页,快速展示自己的创作。此外,平台提供了全球优秀作品的参考,极大激发灵感。更有一键美化功能,让网页焕然一新,分享权限也能自由控制。 谷歌以 320 亿美元收购网络安全公司 Wiz,创下其历史上最大收购案。Wiz 在 18 个月内实现 1 亿美元年收入,成为史上最快的软件公司之一。创始团队拥有近 20 年的友谊和合作,先后成立 Adallom 并被微软收购,再打造 Wiz。
2025-03-20
今天是2025年3月20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 19 日至 3 月 20 日)的 AI 相关新闻: 3 月 20 日: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 3 月 19 日: “回答我!Look in my eyes!Tell me why?baby why?”——最近全网都被这句魔性古风骂人视频刷屏了!古人+现代梗的爆笑碰撞,不只是娱乐玩梗,更成了宣传、带货、文旅推广的新利器。本文手把手教你 0 基础复刻这类 AI 视频,搭配爆款文案+AI 人物+鬼畜视频合成,让你也能轻松玩转流量密码,打造自己的“AI 古人爆款工厂”! 在 GTC2025 大会上,黄教主分享了十五个“饼”,涵盖数据中心的未来、强大的 CUDA、边缘计算与 6G 结合、汽车智能驾驶安全方案等多个领域。他强调,未来推理需求将暴增,并推出新款 NVL72 服务器,性价比显著提升。管推出了多项创新,黄教主仍未解答算力通缩的疑问,未来的硬件发展将面临更多挑战。延伸阅读:《[“AI 工厂时代降临”:黄仁勋 GTC2025 主旨演讲图文全文 3 万字》
2025-03-20
现在是2025年3月18日,我现在要整理一份AI行业的最新动态,在每天早上十点发布,请你整理今天的最新动态,10条左右
以下是 2025 年 3 月 18 日 AI 行业的最新动态: 1. 3 月 AI 发展持续升温。 2. 3 月潞晨科技发布 OpenSora。 3. 3 月 Suno 发布 V3 版本爆火。 4. OpenAI CPO Kevin Weil 访谈亮点:GPT5 近在眼前,将融合多个模型能力,快速推进,AI 代码自动化将在今年内达到 99%,强化推理能力和大规模预训练是关键方向,AI 不仅会写代码,还将让人人都能成为软件创造者。 5. 2025 年职场思考与建议:高管们面临“经验贬值”与“转型焦虑”,非 AI 公司的估值与融资变难,软件开发方式正被重构,“等风来”的代价越来越高,加入 AI 公司也并非万能,市场冷却下招聘更挑剔。 6. 你的孩子可能已经在用 AI“作弊”。 7. 过去一年,头部 AI 应用的品类变化不显著,创意工具仍占据最大比重。 8. 2024 年 9 月,OpenAI 发布新一代语言模型 o1,采用全新训练与推理方案,结合强化学习技术,显著增强推理能力,可能通过生成内部“思维链”模拟人类系统 2 思维方式。 9. 5 月伊莉雅离开 OpenAI,AI 竞争白热化。 10. 5 月伊利亚成立新公司,估值超五亿美金。
2025-03-18
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12
截止今天最强的模型是哪个
目前很难确切地指出截止今天最强的模型是哪一个。以下是一些表现出色的模型: Gemini Ultra:在报告的 32 个基准测试中,在 30 个基准测试中取得了 SOTA,包括多个领域的测试。它是第一个在 MMLU 上实现人类专家水平表现的模型,在多模态推理任务方面也有显著进展。 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。OpenAI 表示下一代 o3mini 模型的推理能力很强。 Gemini 2.0 Flash:Google 发布的该模型在重要的基准能力上,直接追平甚至部分超越了 Gemini 1.5 Pro,且模型速度有极大提升。 Llama 3.1:是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。 需要注意的是,模型的性能评估会因不同的基准测试和应用场景而有所差异,而且技术在不断发展,最强模型的定义也可能随之变化。
2025-03-05