Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

可灵AI近期有哪些重大更新

Answer

快手 AI 产品“可灵”近期的重大更新如下:

  1. 今年 6 月,凭借“让老照片动起来”、“让照片中的人拥抱”等热点在互联网爆火,以高质量视频效果、低价格和良心免费额度获好评。
  2. 9 月更新了 1.5 模型能力,使视频的画面表现力、提示词理解能力、画面清晰度大幅提升,位列视频生成产品第一梯队。
    • 1.0 模型生成一次视频消耗 10 灵感值,1.5 模型消耗 35 灵感值。
    • 免费用户每日免费享 66 灵感值,付费用户享有 1.5 模型、去水印、高清晰度视频生成、视频延长能力、大师运镜、AI 生图画质增强能力。
    • 增加了运动笔刷控制。
    • 1.5 模型在画面表现力、提示词理解能力上有大幅提升,改善了此前将相机运动描述当作实物生成的问题,但视频中文本内容生成仍有待改进。
  3. 移动端 APP 为快影,网页版访问地址为:https://klingai.kuaishou.com/ ,使用指南:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxp#section=h.j6c40npi1fan 。
  4. 传统 txt2vid、img2vid 以外,还支持首尾帧控制、延长视频、对口型能力。txt2vid 模式下支持运镜控制,普通用户可使用水平/垂直运镜、推进/拉远、垂直/水平摇镜;另有四种大师运镜仅付费用户可用。
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?Xiaohu.AI日报「11月21日」✨✨✨✨✨✨✨✨1⃣️✨OpenAI更新GPT-4o提升了写作能力,对上传文件提供更深入的见解和更彻底的响应。测试发现文件解读能力有所增强,但响应速度下降。更新的API已发布,版本号为gpt-4o-2024-11-20。?[https://x.com/imxiaohu/status/1859389544656928828](https://x.com/imxiaohu/status/1859389544656928828)2⃣️?Comfyui_Object_Migration:一致性换衣模型可高精度迁移服装样式到目标人物图像,保持高一致性和细节完整性。支持从卡通到写实的风格互相转换,甚至可将平面角色图像转换为可3D打印的模型。应用场景包括:虚拟角色服装设计迁移到真实照片。为动画角色添加写实服装。微调权重生成独特服装设计。?详细介绍及教程:[https://xiaohu.ai/p/15589](https://xiaohu.ai/p/15589)?GitHub:[https://github.com/TTPlanetPig/Comfyui_Object_Migration](https://github.com/TTPlanetPig/Comfyui_Object_Migration)3⃣️?快手AI产品“可灵”月流水破千万

XiaoHu.AI日报

?Xiaohu.AI日报「11月21日」✨✨✨✨✨✨✨✨1⃣️✨OpenAI更新GPT-4o提升了写作能力,对上传文件提供更深入的见解和更彻底的响应。测试发现文件解读能力有所增强,但响应速度下降。更新的API已发布,版本号为gpt-4o-2024-11-20。?[https://x.com/imxiaohu/status/1859389544656928828](https://x.com/imxiaohu/status/1859389544656928828)2⃣️?Comfyui_Object_Migration:一致性换衣模型可高精度迁移服装样式到目标人物图像,保持高一致性和细节完整性。支持从卡通到写实的风格互相转换,甚至可将平面角色图像转换为可3D打印的模型。应用场景包括:虚拟角色服装设计迁移到真实照片。为动画角色添加写实服装。微调权重生成独特服装设计。?详细介绍及教程:[https://xiaohu.ai/p/15589](https://xiaohu.ai/p/15589)?GitHub:[https://github.com/TTPlanetPig/Comfyui_Object_Migration](https://github.com/TTPlanetPig/Comfyui_Object_Migration)3⃣️?快手AI产品“可灵”月流水破千万

AI视频爆发式更新- 近半年闭源产品趋势

今年6月,被誉为国产之光的Kling凭借“让老照片动起来”、“让照片中的人拥抱”等多个热点在互联网爆火。并凭借高质量视频效果、极低的价格和良心的免费额度狠狠刷了一波好感。9月更新了1.5模型能力,让视频的画面表现力、提示词理解能力、画面清晰度直接上了一个台阶,位列视频生成产品第一梯队。现阶段免费用户每日免费享66灵感值,1.0模型生成一次视频消耗10灵感值,1.5模型则消耗35灵感值。付费用户享有1.5模型、去水印、高清晰度视频生成、视频延长能力、大师运镜、AI生图画质增强能力。移动端APP:快影网页版访问:https://klingai.kuaishou.com/使用指南:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxp#section=h.j6c40npi1fan传统txt2vid、img2vid以外,Kling还支持首尾帧控制、延长视频、对口型能力。txt2vid模式下支持运镜控制,普通用户可使用水平/垂直运镜、推进/拉远、垂直/水平摇镜;另有四种大师运镜很有意思,仅付费用户可用。9月中,Kling在1.0模型中增加了运动笔刷控制。此次更新的1.5模型能力在画面表现力、提示词理解能力上有大幅提升,改善了此前会将相机运动描述当作实物生成的问题。但视频中文本内容生成还是做不到,具体案例可在下文中的视频生成能力测评中查看。在我的评测中,可灵的优势在于运动幅度较大,能产生一些惊喜效果(这点类似Luma,在img2vid中甚至优于Runway)。但是在视频清晰度、语义理解、画面表现力上,Kling 1.0都比Runway、Luma的最新模型弱很多。但1.5进步非常明显,达到了我心中付费产品的水平。

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
可灵api
ComfyUI GeminiAPI 相关内容如下: 用途:用于在 ComfyUI 中调用 Google Gemini API。 安装说明: 手动安装: 1. 将此存储库克隆到 ComfyUI 的 custom_nodes 目录。 2. 安装所需依赖: 如果使用 ComfyUI 便携版。 如果使用自己的 Python 环境。 通过 ComfyUI Manager 安装: 1. 在 ComfyUI 中安装并打开 ComfyUI Manager。 2. 在 Manager 中搜索“Gemini API”。 3. 点击安装按钮,安装完成后重启 ComfyUI。 节点说明: Gemini 2.0 image:通过 Gemini API 生成图像的节点。 输入参数: prompt(必填):描述想要生成的图像的文本提示词。 api_key(必填):Google Gemini API 密钥(首次设置后会自动保存)。 model:模型选择。 width:生成图像的宽度(512 2048 像素)。 height:生成图像的高度(512 2048 像素)。 temperature:控制生成多样性的参数(0.0 2.0)。 seed(可选):随机种子,指定值可重现结果。 image(可选):参考图像输入,用于风格引导。 输出: image:生成的图像,可以连接到 ComfyUI 的其他节点。 API Respond:包含处理日志和 API 返回的文本信息。 使用场景: 创建独特的概念艺术。 基于文本描述生成图像。 使用参考图像创建风格一致的新图像。 基于图像的编辑操作。 API key 获取:在 Google 的 AI Studio 申请一个 API key(需要网络环境),有免费的额度,访问 https://aistudio.google.com/apikey?hl=zhcn 。 温度参数说明:温度值范围为 0.0 到 2.0,较低的温度(接近 0)生成更确定性、可预测的结果,较高的温度(接近 2)生成更多样化、创造性的结果,默认值 1.0 平衡确定性和创造性。 注意事项: API 可能有使用限制或费用,请查阅 Google 的官方文档。 图像生成质量和速度取决于 Google 的服务器状态和您的网络连接。 参考图像功能会将您的图像提供给 Google 服务,请注意隐私影响。 首次使用时需要输入 API 密钥,之后会自动存储在节点目录中的 gemini_api_key.txt 文件中。
2025-04-14
可灵视频提示词怎么写
以下是关于可灵视频提示词的写法: 1. 上传基础视频: 点击页面下方的【Pikaddition】按钮。 拖拽或点击上传本地视频。 若自己没有视频,可在“templates”板块使用官方示例视频做测试。 2. 添加主角图片:点击【Upload Image】上传角色图片文件。 3. 编写视频提示词: 若需要参考角色在视频里的相关互动,需在输入框用英文描述期望效果(支持 Emoji 辅助),然后点击生成按钮。 Pika 会提供一段默认 prompt,若无特殊想法,可直接使用。 建议在自己的提示词尾部加入官方提供的默认提示词,效果会更好。 提示词公式参考: 事件驱动句式:As... 空间锁定技巧:使用场景物体作坐标轴:on the.../behind the.../from the... 动态呼应原则:角色动作与视频元素联动:swaying with.../reacting to.../matching... 核心逻辑:Pikadditions 的核心功能是用户上传实拍视频和角色图片,AI 将角色动态融入视频中。因此,提示词需要具体描述角色在视频中的动作、互动和场景匹配。 此外,对于 Adobe Firefly 的提示词技巧: 明确且具体描述,尽量使用更多词汇来具体描述光线、摄影、色彩、氛围和美学风格。 提示词公式:镜头类型描述+角色+动作+地点+美学风格。 镜头类型描述:相机的视角是什么?它是如何移动的?示例:“一个特写镜头,缓慢推近。” 角色描述:角色是谁?他们长什么样子?他们穿着什么?他们的情绪如何?示例:“一只体型庞大的北极熊,拥有明亮的白色毛皮,看起来若有所思。” 动作:角色在场景中做什么?示例:“北极熊正轻柔而自信地走向它之前在冰面上打开的一个洞,准备在冰面下捕猎。” 地点:角色在哪里?天气如何?地形是怎样的?示例:“地点是一片荒凉的雪地;远处灰蒙蒙的云朵缓慢移动。” 美学风格:这是什么类型的镜头?氛围是怎样的?景深如何?示例:“电影感、35mm 胶片、细节丰富、浅景深、散景效果。” 构建提示词时,建议限制主题数量,过多的主题(超过四个)可能会让 Firefly 感到困惑。
2025-03-12
可灵ai是什么
可灵 AI 是一款视频生成类的产品,其网址为 klingai.kuaishou.com,所属公司为快手。在第 34 期“Video Battle 视频挑战赛 The Moment”中,由可灵 AI 出题,主题为“The Moment”,要求以该主题进行创作,工具要求使用可灵 AI,视频需带可灵水印。参赛有诸多限制和要求,如提交时间为 12 月 31 日 21:00 前,参赛文件格式为 16:9、不长于 10 秒、30FPS 以上且不含剪辑,作业方式不限等。奖项设置包括金奖 5000 元 + 5800 灵感值、银奖 3000 元 + 2700(2200 + 500)灵感值、铜奖 2000 元 + 1000 灵感值、入围 500 元×40、人气奖 2500 元×4 以及其他意外散落的灵感值。
2025-03-09
我想学习可灵ai的提示词
以下是一些关于可灵 AI 提示词的相关资源和信息: 提示词模板相关网站: 生成新年场景的提示词示例: 戴着醒狮帽,双手抱拳,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 拿着"福"字,新年气氛,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 关于律师如何写好提示词用好 AI 的观点: 不能期待设计一个完美的提示词,然后 AI 百分百给到一个完美的符合要求的答案,中间不能有谬误,否则就是一个需要修复的“BUG”。 要给到 AI 的提示词实际上是一个关于此项问题的相对完善的“谈话方案”,真正的成果需要在对话中产生,并且在对话中限缩自己思维中的模糊地带。
2025-02-16
可灵AI视频好用吗
可灵 AI 视频具有以下特点和优势: 1. 今年 6 月爆火,凭借“让老照片动起来”等热点刷了一波好感。9 月更新 1.5 模型能力,使视频的画面表现力、提示词理解能力、画面清晰度上了一个台阶,位列视频生成产品第一梯队。 2. 现阶段免费用户每日免费享 66 灵感值,1.0 模型生成一次视频消耗 10 灵感值,1.5 模型则消耗 35 灵感值。付费用户享有 1.5 模型、去水印、高清晰度视频生成、视频延长能力、大师运镜、AI 生图画质增强能力。 3. 移动端 APP 为快影,网页版访问地址为:https://klingai.kuaishou.com/ ,使用指南:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxpsection=h.j6c40npi1fan 。 4. 除传统 txt2vid、img2vid 外,还支持首尾帧控制、延长视频、对口型能力。txt2vid 模式下支持运镜控制,普通用户可使用水平/垂直运镜、推进/拉远、垂直/水平摇镜;另有四种大师运镜仅付费用户可用。9 月中,在 1.0 模型中增加了运动笔刷控制。 5. 1.5 模型能力在画面表现力、提示词理解能力上有大幅提升,改善了此前会将相机运动描述当作实物生成的问题,但视频中文本内容生成还做不到。 6. 在评测中,优势在于运动幅度较大,能产生惊喜效果,但在视频清晰度、语义理解、画面表现力上,1.0 比 Runway、Luma 的最新模型弱很多,1.5 进步明显,达到付费产品水平。 在 AI 视频生成领域,可灵的优势主要体现在: 1. 卓越的视频生成质量,在画面清晰度、连贯性、内容丰富性上,达到与国际顶级模型相当的水准,满足普通用户和专业创作者需求。 2. 生成速度表现出色,处理效率高于国外同类产品,能提升用户工作效率。 3. 对于国内用户,可访问性强,提供便捷、稳定的使用体验,降低使用门槛。 此外,快手于 6 月发布“可灵”视频大模型,能生成超过 120 秒 1080P 视频,模拟真实物理特性,准确建模复杂运动场景,采用类 Sora 的 DiT 结构,用 Transformer 代替卷积网络,自研 3D VAE 网络提升视频重建质量。
2025-02-01
怎么最快掌握可灵AI
以下是关于最快掌握可灵 AI 的一些建议: 可灵是由快手团队开发的一款 AI 应用,主要用于生成高质量的图像和视频。 对于初学者,建议您按照以下步骤来尽快掌握: 1. 了解可灵的基本功能和特点:可灵生成的图像质量非常高,但价格相对较高。最初采用内测邀请制,现在已向所有用户开放使用。 2. 考虑使用成本:重度用户的年费可能达几千元人民币,平均每月使用成本在 400 到 600 元之间。临时或轻度使用有每日免费点数和 60 多元单月的最便宜包月选项。 3. 实践操作:可以先从完成简单的图像生成任务开始,逐渐熟悉其操作流程和参数设置。 同时,为了更深入学习 AI,您还可以参考以下简明入门教程,在 20 分钟内循序渐进地完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。
2025-01-25
我是一个ai新手,请根据知识库现有的内容帮我拟一份学校ai的学习计划,以及更新知识的跟进和学习
以下是为您拟定的学校 AI 学习计划,以及知识更新的跟进和学习方法: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键。尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 六、持续学习和跟进 AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 希望这份学习计划对您有所帮助,祝您在 AI 学习的道路上取得成功!
2025-03-31
帮我列举2025年3月1日以来,国内外、闭源开源模型厂商的更新记录。
以下是 2025 年 3 月 1 日以来,国内外、闭源开源模型厂商的部分更新记录: 2025 年 3 月 20 日,OpenAI 推出了一套全新的音频模型,旨在通过 API 为开发者提供更智能、更可定制的语音代理支持,包括改进的语音转文本和文本转语音功能,为语音交互应用带来显著提升。 李开复公开表示 OpenAI 面临生存危机,商业模式不可持续。他强调中国的 DeepSeek 以极低成本提供接近的性能,开源模式将主导未来 AI 发展。他认为企业级 AI 应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大 AI 玩家,竞争愈发激烈。 SuperCLUE 发布《中文大模型基准测评 2025 年 3 月报告》,指出 2022 2025 年经历多阶段发展,国内外模型差距缩小。测评显示 o3mini总分领先,国产模型表现亮眼,如 DeepSeekR1 等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek 系列模型深度分析表明,其 R1 在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。 以上信息来源包括: 《》 《》 《》
2025-03-26
Way to AGI 近期更新
Way to AGI 近期更新如下: 3 月 8 日: 《》:专为 AI 小白打造的实用指南,涵盖基础概念、30 分钟 AI 工具速成体验、Deepseek 使用指南、WayToAGI 知识库导航、Coze 智能体搭建等核心内容,适合多种人群,强调实践、通俗易懂、循序渐进,并融入社区互动。 《》:Manus 是 AI 驱动的无图形界面 Linux 虚拟机&浏览器,能运行终端命令、访问网页、调用 API,适用于自动化办公、数据分析等任务,但有一定限制,本文基于 8 小时直播测试,带你深入体验其能力、限制与未来可能性。 3 月 7 日: 《》:作者夙愿学长介绍了 2025 年必用的十大 AI 工具和工作流,涵盖写作、搜索、语音与视频处理等领域,推荐了 Claude、Gemini 和 Gamma 等工具。 《》:在 6 号晚的 WaytoAGI 直播中,Manus 引发 3 万人围观,展示了其强大的 AI 智能,参与者分享了各种趣味案例。 《》:与传统 AI 不同,“Manus”能完成复杂任务,成为用户在数字世界的“代理人”,创始人强调未来成功的关键在于主动寻找和解决问题的能力。 此外,WaytoAGI 近期活动备份: :2024 年 7 月 26 日9 月下旬,由中国科学技术馆和网易新闻发起,WaytoAGI 作为特别支持社区,即日起向全球征集 AI 音乐歌曲作品,9 月下旬进行线下汇演。8 月 1 日更新。 【线上⬆️】:2024 年 7 月 24 日8 月 8 日,Agent 共学活动新一期“谁是人类”全新开启,获得阿里云☁️百炼和通义千问大模型的支持,准备了丰厚奖品。 【线下⬇️】
2025-03-14
Way to AGI 近期更新
Way to AGI 近期更新如下: 3 月 8 日: 《》:专为 AI 小白打造的实用指南,涵盖基础概念、30 分钟 AI 工具速成体验、Deepseek 使用指南、WayToAGI 知识库导航、Coze 智能体搭建等核心内容,适合多种人群,强调实践、通俗易懂、循序渐进,并融入社区互动。 《》:Manus 是 AI 驱动的无图形界面 Linux 虚拟机&浏览器,能运行终端命令、访问网页、调用 API,适用于自动化办公、数据分析等任务,但有一定限制,基于 8 小时直播测试深入体验其能力、限制与未来可能性。 3 月 7 日: 《》:作者夙愿学长介绍 2025 年必用的十大 AI 工具和工作流,涵盖写作、搜索、语音与视频处理等领域,推荐工具如 Claude、Gemini 和 Gamma。 《》:6 号晚的 WaytoAGI 直播中,Manus 展示强大智能,引发 3 万人围观,参与者分享趣味案例,显示 AI 在代理任务中的潜力与挑战。 《》:与传统 AI 不同,“Manus”能完成复杂任务,成为用户在数字世界的“代理人”,创始人强调未来成功关键在于主动寻找和解决问题的能力,AI 将是放大器,创业者应从小目标出发抓住市场红利,核心壁垒在于对动态机会的把握。 此外,还有以下近期活动: :由中国科学技术馆和网易新闻发起,WaytoAGI 作为特别支持社区,即日起向全球征集 AI 音乐歌曲作品,通过专业评审评选出 10 首歌曲,将在 9 月下旬进行线下汇演。 8 月 1 日更新: 【线上⬆️】:Agent 共学活动新一期“谁是人类”全新开启,获得阿里云☁️百炼和通义千问大模型的支持,准备了丰厚奖品,活动时间为 2024 年 7 月 24 日8 月 8 日。 【线下⬇️】
2025-03-08
你现在有哪些最新更新的内容呢?
以下是最新更新的内容: 1. GPTs 实战:“摩斯密码” 作者景淮为平衡用户能力对内容做了调整,降低提示词复杂度。 文章风格调整,希望帮助为孩子接触 AI 的家长找到切入点。 内容包括需求分析、分步实现需求、提示词编写测试、GPTs 使用链接和总结。 2. 2024 年历史更新(归档) 2024 年 5 月 26 日更新了多份研究报告和演讲报告,包括《PublicFirst:公众如何看待 AI?(英译中)》《通义灵码:软件开发新范式》《人工智能行业:AI 时代最不该焦虑的,其实是内容创作者》《麦肯锡:人工智能行业:工作的新未来》《惠普&上海人工智能研究院:2024AIPC 赋能新质生产力》《百度智能云&长江云:面向 AIGC 的数智广电新质生产力构建白皮书》《COPU&IBM:2024 可信赖的企业级生成式 AI 白皮书》。 3. PixVerse V3 使用指南 本次更新包括已有能力升级,如提供更精准的提示词理解能力和更惊艳的视频动态效果,支持多种视频比例和风格化选择,文生视频和图生视频的风格化。 全新功能上线,如对口型功能、8 个创意效果和视频延长功能。
2025-03-05
近期AI界有什么重大事件吗
以下是 2024 年 AI 界的一些重大事件: 1. 1 月:斯坦福大学 Mobile Aloha、LumaAl Genie 文生 3D、GPT store 上线、MagnificAl 高清放大爆火、苹果 Vision Pro 宣布发售等。 2. 10 月:9 月 27 日 Reecho 睿声●三只羊录音事件涉及 AI 公司出面回应;9 月 28 日 TeleAI●正式开源 TeleChat2115B;10 月 1 日快手●可灵 AI 全面开放 API、OpenAI DevDay;10 月 2 日 Black Forest Labs●发布 FLUX1.1、苹果●推出多模态大模型 MM1.5;10 月 3 日 OpenAI●发布 ChatGPT Canvas;10 月 8 日 2024 年诺贝尔物理学奖;10 月 9 日 2024 年诺贝尔化学奖;10 月 10 日字节●发布首款 AI 智能体耳机 Ola Friend、Vivo●增加蓝心端侧大模型 3B、谷歌●图像生成模型 Imagen 3 开放使用、智源●BGE 登顶 Hugging Face 月榜、State of AI 2024 报告发布;10 月 11 日智谱●GLM4Flash 与「沉浸式翻译」合作、北大&北邮&快手●?开源高清视频生成模型 Pyramid Flow;10 月 12 日 OpenAI●?开源多智能体协作框架 Swarm、深势科技●完成数亿元人民币新一轮融资、苹果●质疑当前 LLM 缺乏真正的逻辑推理能力;10 月 14 日。 3. 关于 AI 在未来一年的 10 个预测:一个主权国家向美国大型人工智能实验室投资 100 亿美元以上,需要国家安全审查;没有任何编码能力的人独自创建的应用程序或网站将会迅速走红(例如 App Store Top100);案件开始审理后,前沿实验室对数据收集实践实施有意义的改变;由于立法者担心权力过度,欧盟人工智能法案的早期实施最终比预期更为缓慢;OpenAl o1 的开源替代品在一系列推理基准测试中超越了它;挑战者未能对 NVIDIA 的市场地位造成任何重大打击;由于公司难以实现产品与市场的契合,对人形机器人的投资水平将会下降;苹果设备上研究的强劲成果加速了个人设备上 AI 的发展势头;人工智能科学家撰写的研究论文被大型机器学习会议或研讨会接受;一款以与 GenAI 元素交互为基础的视频游戏将取得突破性进展。
2025-01-17
人工智能的发展历史及各个阶段起到关键作用的重大突破
人工智能的发展历史可以追溯到 20 世纪 50 年代,以下是各个阶段起到关键作用的重大突破: 1. 20 世纪 50 年代: 纽维尔和西蒙开发了名为“逻辑理论家”的程序,能够证明数学定理,此后又开发了“通用问题求解器”。意义:作为符号学派的代表,为形式化证明打开了大门。 英国数学家阿兰·图灵提出了著名的“图灵测试”。 2. 20 世纪 60 年代: 美国心理学家弗兰克·罗森布拉特提出了感知机模型,这是一种具有学习能力的神经网络。意义:开创了连接主义学派,为 DNN 学习范式开启了窗口。 3. 1971 年到 2015 年间,与电子游戏相关的人工智能研究论文数量不到 1000 篇,但从 2015 年到 2022 年的 7 年里,相关论文数量就达到 1625 篇,其中 17 篇成为《自然》和《科学》的封面文章。 4. 1997 年:“深蓝”电脑在国际象棋比赛中战胜世界冠军卡斯帕罗夫。 5. 2016 年:AlphaGo 在围棋比赛中战胜世界冠军李世石。 6. 2020 年:GPT3 发布,非常擅长用电脑写文章和做其他很多用语言的事情。 7. 2022 年:DALLE 发布,可以根据描述画出想象中的图画。 8. 2023 年:GPT4 发布。 在快速发展的过程中,众多巨人开创了具有重大意义的里程碑事件,推动了人工智能的不断进步。
2024-12-05
面試主管請您於第二次面試時回答以下三個問題並以PPT呈現出來。 1. AI 在教育中的發展趨勢 AI 技術未來幾年在教育領域的發展趨勢是什麼?哪些創新技術或應用會對教育產生重大影響? 2. AI 對教育角色的改變 隨著 AI 的應用增多,教師和學生的角色會發生哪些轉變?您如何看待 AI 在教學過程中的定位? 3. AI 賦能的教育未來 請描述一個您心中 AI 賦能的未來教育場景。這個場景下,AI 如何幫助學生、教師和管理者提升教學與學習體驗?
很抱歉,目前知识库中没有关于您所提到的这三个问题的相关内容。但以下是为您提供的一些初步分析和思路: 对于“AI 在教育中的发展趋势”: AI 技术在未来几年于教育领域的发展趋势可能包括更加个性化的学习体验、智能化的教学辅助工具、虚拟现实和增强现实技术的融合应用等。创新技术如自适应学习系统能够根据学生的学习进度和特点提供定制化的学习内容;自然语言处理技术可以实现更智能的辅导和答疑。 对于“AI 对教育角色的改变”: 随着 AI 的应用增多,教师可能会从知识传授者转变为引导者和促进者,更多地关注学生的情感需求和综合素质培养。学生则会更加主动地参与学习过程,成为自我导向的学习者。AI 在教学过程中可以作为辅助工具,帮助教师提高教学效率,为学生提供个性化支持。 对于“AI 赋能的教育未来”: 在一个 AI 赋能的未来教育场景中,学生可以通过智能设备随时随地获取个性化的学习资源,AI 能够根据学生的学习情况实时调整教学内容和进度。教师可以借助 AI 分析学生的学习数据,更精准地进行教学设计和辅导。管理者能够利用 AI 进行教育资源的优化配置和决策制定,提升教育管理的效率和质量。 以上内容仅供参考,您可以根据实际情况进一步深入研究和完善。
2024-10-11
人工智能发展的流程图上面有相关人物与重要时间节点或重大事件
以下是人工智能发展的流程图相关内容,包含重要人物与重要时间节点或重大事件: 二十世纪中叶,人工智能领域开启。最初符号推理流行,带来专家系统等重要进展,但因提取知识成本高等问题,20 世纪 70 年代出现“人工智能寒冬”。 近现代,计算机科学发展为人工智能研究奠定基础,人们尝试用机器模拟人类思维。 1950 年,英国数学家阿兰·图灵提出著名的“图灵测试”。 1956 年,人工智能一词被提出,达特茅斯会议举行。 1997 年,深蓝在国际象棋比赛中击败卡斯帕罗夫。 2016 年,AlphaGo 在围棋比赛中战胜李世石。 2020 年,GPT3 发布。 2022 年,DALLE 发布。 2023 年,GPT4 发布。 2024 年,预计发布 GPT5 。 随着时间推移,计算资源变便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中“人工智能”常被用作“神经网络”的同义词。
2024-09-16
过去半年AI领域重大产品发布的总结
以下是过去半年 AI 领域重大产品发布的总结: Microsoft:在 Build 2023 发布了 50 多项与 AI 相关的新产品。 Google: 将图像生成功能整合进了商业营销工具与 Bard,并正式开始测试 AI 版搜索引擎。 发布新一代 LLM PaLM2,I/O 大会发布的大部分 AI 产品以此为基础模型。 正在研发多模态大模型 Gemini。 Bard 基于 PaLM2 运行,向所有用户全面放开,并将逐步增加适配语言,具备多种新功能。 Meta:开源了基于圣经训练的,可以识别超过 4,000 种口语,对 1,100 多种语言进行语音文字互换的 MMS 模型。 NVIDIA:突破万亿美元市值,其华人 CEO 黄仁勋在 COMPUTEX 大会上发布了一系列产品,包括搭载了 256 颗 GH200 Grace Hopper 超级芯片的新型 DGX GH200 超算。 此外,还有以下相关内容: 3 个新话题:媒体该如何更有价值地进行 AI 报道、不同国家在如何制定 AI 相关政策、关于 AI 安全有哪些重要的观点。 14 个新产品:包括 4 个有用的、3 个好玩的、5 个初创公司的新产品以及 2 家大公司的新动态。 10 篇新论文:提供了论文原文链接与最具代表性的 Twitter Thread。 在国内,过去几个月内的 AI 大模型大多处于发布会阶段,远未达到可商用化,而全球只有 OpenAI 能够达到通用 AI 的商业化,且拥有绝大部分用户的市场。截至今年 5 月 28 日,中国 10 亿参数规模以上的大模型已发布 79 个。美国、中国占全球已发布大模型总量的 80%以上。ChatGPT 的出现标志着通用 AI 的起点和强 AI 的拐点,是 AI 领域科技创新和成果应用的一次重大突破。
2024-09-14