Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

那款AI可以让静态变动态I

Answer

以下是一些可以让静态变动态的 AI 工具和方法:

  1. Hailuo AI 推出的 I2V-01-Live 新功能,能够为静态 2D 插画加入流畅动画,赋予角色生命力,支持多种艺术风格,动作细节表现真实流畅。相关链接:https://x.com/imxiaohu/status/1863968974612091125
  2. 腾讯 Hunyuan 是 130 亿参数开源视频模型,能生成高质量视频,动作连贯自然,镜头切换灵活,具备强大语义跟随能力。官网:https://aivideo.hunyuan.tencent.com 代码:https://github.com/Tencent/HunyuanVideo
  3. 可以通过教程学习用 AI 制作动画视频播客,比如五步学会的方法。相关链接:https://youtu.be/-fj81cg5bf0 https://x.com/imxiaohu/status/1864157642605953268
  4. 可以使用即梦、runway 等工具,比如在剪映里添加 PNG 透明底图并导出。
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?Xiaohu.AI日报「12月04日」✨✨✨✨✨✨✨✨1⃣️?AI教程:五步学会用AI制作动画视频播客五个步骤教你从零到一制作动画版视频播客。适合有一定技术基础的朋友,轻松上手创作动画视频!?[https://youtu.be/-fj81cg5bf0](https://youtu.be/-fj81cg5bf0)?[https://x.com/imxiaohu/status/1864157642605953268](https://x.com/imxiaohu/status/1864157642605953268)2⃣️?Hailuo AI推出I2V-01-Live新功能:让静态2D插画“活”起来!从静态到动态:为2D插画加入流畅动画,赋予角色生命力。多风格支持:适配漫画、卡通等多种艺术风格,创作更自由。细腻自然:捕捉细微动作细节,表情、眨眼等表现更加真实流畅。?[https://x.com/imxiaohu/status/1863968974612091125](https://x.com/imxiaohu/status/1863968974612091125)3⃣️?腾讯Hunyuan:130亿参数开源视频模型高质量视频生成,动作连贯自然,镜头切换灵活。具备强大语义跟随能力,适配新一代语言模型作为文本编码器。采用类似Sora的DiT架构,显著提升影视级动态表现力。?[https://x.com/imxiaohu/status/1863885812888433035](https://x.com/imxiaohu/status/1863885812888433035)?官网:[https://aivideo.hunyuan.tencent.com](https://aivideo.hunyuan.tencent.com)?代码:[https://github.com/Tencent/HunyuanVideo](https://github.com/Tencent/HunyuanVideo)

XiaoHu.AI日报

?Xiaohu.AI日报「12月04日」✨✨✨✨✨✨✨✨1⃣️?AI教程:五步学会用AI制作动画视频播客五个步骤教你从零到一制作动画版视频播客。适合有一定技术基础的朋友,轻松上手创作动画视频!?[https://youtu.be/-fj81cg5bf0](https://youtu.be/-fj81cg5bf0)?[https://x.com/imxiaohu/status/1864157642605953268](https://x.com/imxiaohu/status/1864157642605953268)2⃣️?Hailuo AI推出I2V-01-Live新功能:让静态2D插画“活”起来!从静态到动态:为2D插画加入流畅动画,赋予角色生命力。多风格支持:适配漫画、卡通等多种艺术风格,创作更自由。细腻自然:捕捉细微动作细节,表情、眨眼等表现更加真实流畅。?[https://x.com/imxiaohu/status/1863968974612091125](https://x.com/imxiaohu/status/1863968974612091125)3⃣️?腾讯Hunyuan:130亿参数开源视频模型高质量视频生成,动作连贯自然,镜头切换灵活。具备强大语义跟随能力,适配新一代语言模型作为文本编码器。采用类似Sora的DiT架构,显著提升影视级动态表现力。?[https://x.com/imxiaohu/status/1863885812888433035](https://x.com/imxiaohu/status/1863885812888433035)?官网:[https://aivideo.hunyuan.tencent.com](https://aivideo.hunyuan.tencent.com)?代码:[https://github.com/Tencent/HunyuanVideo](https://github.com/Tencent/HunyuanVideo)

教程:端午节动态视频

我这用的即梦,也可以用runway等(如果要字不动,可以先去在剪印里添加文字logo素材)先什么关键词都不写,如果效果不满意,再添加关键词即梦runway画笔[heading2]5、剪映里把视频放进去(AJ操作)[content]PNG透明底图放上导出[heading2]可以把你的美图交在评论区哦?~祝大家端午节快乐~

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
有没有那款智能客服软件,具备接入全渠道平台的客户咨询能力
以下是为您推荐的一些具备接入全渠道平台客户咨询能力的智能客服软件: 1. 阿里云百炼:可以在几分钟内构建一个 AI 助手,并发布到网站、钉钉或微信公众号中。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,且缺少技术人员开发大模型问答应用的情况。其智能体应用基于大模型,通过集成特定的外部能力,能够弥补大模型的不足,例如回答私有领域问题、获取最新信息等。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 2. COW 框架:是基于大模型搭建的 Chat 机器人框架,可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,支持多平台接入(微信、企业微信、公众号、飞书、钉钉等)、多模型选择(GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等)、多消息类型支持(能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能)和多部署方法(本地运行、服务器运行、Docker 的方式)。但需要注意的是,使用此框架接入大模型 API 需单独付费,且微信端使用可能存在封号危险,操作时需依法合规。 此外,利用 AI 聊天机器人实现客户服务自动化也是常见的做法。通过部署 AI 聊天机器人处理常见的客户咨询,将其集成到企业的网站、社交媒体平台和其他客户服务渠道,能够提高客户服务的效率和可及性。同时,通过机器人提供 24/7 客户支持,定期监控其性能并根据反馈进行优化,能够提升响应速度和服务质量。
2025-03-05
小公司, 想部署一个本地ai系统,希望它能够, 对运维, 运营, 客服, 美术, 策划, 程序都能够有很大的帮助, 目前市面上那款 ai 模型比较合适
对于小公司想要部署一个能对运维、运营、客服、美术、策划、程序都有帮助的本地 AI 系统,以下是一些相关信息: 线上和线下本地部署的 AI 特点: 线上部署的优势在于出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图尺寸受限。线下部署的优势是可添加插件,出图质量高,但使用时电脑可能宕机,配置不高可能爆显存导致出图失败。建议线上用于找参考、测试模型,线下作为主要出图工具。 Ollama: 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同场景。 易于使用,适用于 macOS、Windows 和 Linux 系统,支持 CPU 和 GPU。 提供模型库,用户可从中下载不同模型,满足不同需求和硬件条件。 支持自定义模型,可调整参数。 提供 REST API 用于运行和管理模型,以及与其他应用集成。 社区贡献丰富,有多种集成插件和界面。 Google Gemma: 是 Google 发布的家用版小模型,有 2b(20 亿参数)和 7b(70 亿参数)版本。小模型可能不适合复杂任务,但适合提升基础操作效率。部署环境友好,可通过 ollama 方便部署,支持热加载模型文件。2b 反应速度快但互动话题有限,7b 输出质量高但可能卡顿,对非英文语种反馈不稳定。 综合考虑,如果您的公司对出图质量要求较高,且有较好的硬件配置,可以选择线下部署结合线上测试的方式。在语言模型方面,Ollama 具有较多优势,可根据具体需求选择合适的模型进行部署。
2025-03-04
小游戏公司, 想部署一个本地ai系统,希望它能够, 对运维, 运营, 客服, 策划, 程序都能够有很大的帮助, 目前市面上那款 ai 模型比较合适
对于小游戏公司部署本地 AI 系统以帮助运维、运营、客服、策划和程序等方面,以下是一些建议和相关信息: 目前市面上的 AI 模型各有特点。线上 AI 具有出图速度快、不依赖本地显卡配置、无需下载大型模型以及能参考其他创作者作品等优势,但出图尺寸受限。线下部署的 AI 可以添加插件、出图质量高,但可能导致电脑宕机且对配置要求高。 在游戏领域,AI 大模型带来了诸多变化,如游戏内容辅助生成(包括文、图、3D 和音乐),可应用于游戏策划人和美术设计师。文生图和图生图能提高创作效率,动画辅助渲染可改变角色风格,游戏智能运营涵盖智能 NPC 互动、客服、攻略问答和代码脚本生成等,适用于产品经理、运营经理和社区运营经理。 Google 刚刚发布的家用版小模型 Gemma 有 2b(20 亿参数)和 7b(70 亿参数)版本。相对千亿参数的大模型,这类小模型可能不太适合处理复杂任务,但代表了模型本地化提升基础操作效率的趋势。Ollama 是一个开源的大型语言模型服务,方便部署最新版本的 GPT 模型并通过接口使用,支持热加载模型文件,且像小型的 llama 也支持本地部署。部署时,需进入 ollama.com 下载程序并安装,通过命令提示符进行操作和切换模型。2b 反应速度快但互动话题有限,7b 输出质量高但可能卡顿,且对非英文语种反馈不太稳定。 综合考虑,小游戏公司可以根据自身需求和硬件配置选择合适的 AI 模型。如果对出图质量要求高且有较好的硬件配置,可尝试线下部署;若更注重效率和便捷性,线上模型可能更适合。同时,也可以考虑像 Gemma 这样的小模型进行本地化部署以提升基础操作效率。
2025-03-04
小游戏公司, 想部署一个本地ai系统,希望它能够, 对运维, 运营, 客服, 美术, 策划, 程序都能够有很大的帮助, 目前市面上那款 ai 模型比较合适
对于小游戏公司部署本地 AI 系统以帮助运维、运营、客服、美术、策划、程序等方面,以下是一些建议和目前市面上合适的 AI 模型分析: 线上 AI 平台的优势在于出图速度快,对本地显卡配置要求低,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限制。 线下部署的优势是可以添加插件,出图质量高,但使用时电脑可能宕机,配置不高还可能爆显存导致出图失败。 综合考虑,建议充分发挥线上和线下平台的优势。线上可用于找参考、测试模型,线下作为主要出图工具。 在图像生成方面,2022 年主流生成式图像应用如 DALLE 2.0、Stable Diffusion 和 Midjourney 使图像生成精细化程度提升,提示对图像生成结果的控制能力增强。 在 3D 模型生成中,AI 能完成 3D 模型生成流程的“一步到位”,大大提升效率。 在游戏开发中,AI 可用于游戏内容辅助生成(如文、图、3D、音乐)、动画辅助渲染、游戏智能运营(包括智能 NPC 互动、客服、攻略问答、代码和脚本生成)等。 对于小游戏公司,Stable Diffusion 可能是一个较为合适的选择,它在 2D 美术素材辅助生成方面能够提高创作效率、降低成本,并且有多种应用场景,如文生图、图生图等。同时,也可以考虑结合线上平台进行参考和测试。
2025-03-04
那款工具提供了风格迁移
以下是一些提供风格迁移功能的工具: 1. Comfyui flatten 光流重绘:通过改变参数可生成不同视频效果。在使用中,如果遇到人物不能变化,可以加入对应的提示词增强和调整 cfg 的权重。负面提示词一般不填,由 Unsampler 完成。old_qk 参数控制生成过程中保留原始内容的程度,设置为 1 时更多保留原始内容,更贴合提示词;设置为 0 时允许更大变化。add_noise 有助于使用像 IPAdapter 这样的风格迁移工具,因为额外的噪声可提供更多变化空间,使风格转换更显著。采样器选择方面,dpmpp_2m 适合保持视频一致性,LCM(Latent Consistency Model)采样器更适合大幅度的场景改变。 2. 辅助工具:ICLight“重打光”: 体验链接: 控制网作者张吕敏刚放出来的大杀器:https://github.com/lllyasviel/ICLight 体验地址:https://huggingface.co/spaces/lllyasviel/ICLight 可以传一张图,选择光源位置,填上提示词,一张新的有光源角度的融合背景的图就产生了。 【Zho】做好了敏神刚放出的打光模型 ICLight 的 Colab 方案:https://colab.research.google.com/drive/1pXSpTHzNhaAKFmMvhxj7Zp9781L2f?usp=sharing 。敏神这些内容都是开源的,可以在各种 UI 里用(只要有人做插件就行),当然也可以自己做成产品加上自己的一些独门绝技放大、风格迁移、动态变化等。 3. 晨然提到的 IpAdapter:IpAdapter 是风格迁移神器,一张图就可以学到草图。但不建议 weight 开太高,否则生图颜色会太像参考图。noise 可以理解为对 Prompt 放行的程度,noise 越大,提示词的比例越大。
2025-02-25
PPT那款AI做的好
以下是一些好用的制作 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下相关的 PPT 生成工具(网站): 1. https://zhiwen.xfyun.cn/ 讯飞智文 2. http://Mindshow.fun Markdown 导入 3. http://kimi.ai 选 PPT 助手,暂时免费效果好 4. http://Tome.app ,AI 配图效果好 5. http://Chatppt.com ,自动化程度高 6. https://wenku.baidu.com ,付费效果好 AI 辅助 PPT 的原理和作用包括: 1. 减轻排版工作的压力。 2. 生成打底的内容,减轻人写内容的工作。例如文章生成 PPT 时,让 AI 帮忙摘要内容,生成大纲列表;主题生成 PPT 时,让 AI 根据主题扩充成大纲列表,乃至具体内容。在特定场景下,如学生快速为小组展示配 PPT 时,可能不用修改直接使用。 网站把 AI 输出的文本丢给 LLM,让其根据内容在已有的 UI 组件中选择更适合的组件,按时间线为每页 PPT 的文字选出整个 PPT 中每一页的 UI 组件。有的网站,如 tome、gamma,配图也是由 GenAI 根据页面内容生成的。呈现 AI 生成的 PPT 结果后,用户不满意可以自行选择模版。 WPS AI 也能对 PPT 大纲进行优化和二次修改。
2025-02-19
推荐能生成静态网页的AI
以下是为您推荐的能生成静态网页的 AI 工具: 1. 即时设计:https://js.design/ 这是一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix:https://wix.com/ Wix 是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 5. Genspark:https://www.genspark.ai/s 主要特点是可以根据用户的搜索内容快速生成对应的内容页面。Genspark 是一个 AI 智能体引擎,能够基于用户的查询实时生成自定义页面,称为 Sparkpages。 6. Galileo AI:https://xiaohu.ai/c/ai23cc23/galileoaiuihtmlfigma 可根据文字或图片生成完整 UI 设计,并导出 HTML 和 Figma 文件。 7. UIGENT1:基于 Qwen2.5Coder7B 微调,能根据提示生成标准 HTML/CSS 代码,擅长基础前端页面,如仪表盘、登录页、注册表单等。详细介绍:https://xiaohu.ai/c/a066c4/uigent1ui 模型下载:https://huggingface.co/smirki/UIGENT1Qwen7b 。 内容由 AI 大模型生成,请仔细甄别。
2025-03-19
有哪些AI工具,可以让静态的家电摄影图, 变成立体的视角
目前在 AI 领域,暂时没有直接能将静态的家电摄影图变成立体视角的通用工具。但一些 3D 建模软件,如 Blender、3ds Max 等,结合一定的图像处理技术和 AI 辅助功能,可能在一定程度上帮助您实现类似的效果。不过这需要一定的专业知识和操作技巧。
2025-03-10
静态图片如何通过ai生成动图
以下是将静态图片生成动图的两种方法: 方法一:使用 LivePortrait 1. LivePortrait 可以精确控制眼睛和嘴唇的动作,还能无缝拼接多个肖像,将不同人物特征合并成一个视频,确保过渡自然流畅。 2. 它使用了一种不同于主流扩散方法的隐式关键点框架,在计算效率和可控性之间取得了有效的平衡。生成的动画质量优于现有的非扩散和扩散模型方法。在 RTX 4090 GPU 上,生成速度为每帧 12.8 毫秒,效率显著高于现有的扩散模型。 3. 支持各种风格的图片,常见的动物面部迁移,并可以微调面部运动幅度。 4. 工作流与模型地址: https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy https://pan.quark.cn/s/8dfd7ace4f05 5. 教程: 在 comfyui 里使用工作流、模型:https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 安装包解压即用链接:https://pan.baidu.com/s/1fh9vvLk8OHuIlCJxD7jiBg?pwd=282n 提取码:282n 项目地址:https://github.com/KwaiVGI/LivePortrait 节点地址:https://github.com/kijai/ComfyUILivePortraitKJ 方法二:使用星流一站式 AI 设计工具的图生图功能 1. 图生图功能允许用户上传一张图像,并基于该图像生成新的视觉内容。 2. 应用图生图: prompt 输入框下,点击“图生图”上传本地文件。 无限画布中,在图片功能区进行选择。 3. 调整“图生图”功能区参数: 参考程度: 更像原图:小幅度修改基底图像,有限的增加元素。 更创意:大幅度修改基底图像,可搭配增强模型加入更多的元素。 自定义:可自定义修改重绘幅度。 增加参考纬度:点击添加按钮,会自动的应用并打开“生成器”的图片参考功能。 替换图像:鼠标滑动到图像,点击“选择参考图”即可重新选择图片。 转换提示词:反推参考图信息填入进提示词框中。 同步生图尺寸:同步参考图尺寸到“生成器”的生图尺寸中。
2025-01-20
静态图生成动态图的工具有吗
以下是一些可以将静态图生成动态图的工具: 1. Comfyui LivePortrait: 可以精确控制眼睛和嘴唇的动作,无缝拼接多个肖像,将不同人物特征合并成一个视频,确保过渡自然流畅。 使用了不同于主流扩散方法的隐式关键点框架,在计算效率和可控性之间取得有效平衡。 生成的动画质量优于现有的非扩散和扩散模型方法,在 RTX 4090 GPU 上,生成速度为每帧 12.8 毫秒。 支持各种风格的图片,常见的动物面部迁移,并可以微调面部运动幅度。 工作流与模型地址: https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy https://pan.quark.cn/s/8dfd7ace4f05 内容依技术发展更新,请以文档为准 https://xiaobot.net/post/74238a84d2734b2ca195ed2858b24ffe 2. 视频工具 VIGGLE: Mix(让视频的动作映射到图片人物身上):先上传一个视频和一张角色图像,Viggle 会自动将视频的动态赋予给这个角色,形成一段新视频。能模拟出角色的 3D 状态,准确还原处理原视频中身体旋转、四肢交叠等动作。(也可以利用现有的模版视频作为动作获取来源) Multi(多人模式):通过视频的动作,将上传的多个角色进行识别并赋予给这个角色,形成一段新视频。 Move(将视频的动作直接映射在图片人物身上):不同于 Mix 的图片元素替换原视频内容,Move 主要是通过将动作映射在图像里面的人物身上,实现“让静态图动起来”。 案例: 评价: :https://x.com/imxiaohu/status/1771173928591093940 兄弟们,又出来个牛 P 玩意阿里那个被截胡了,这个直接能用可以直接通过文字描述让任何静态图动起来,而且能做各种动作,跳舞什么的都是小 case...最牛 P 的是,他们的模型能能理解真实世界的物理运动原理,所以出来的视频很真实。不仅如此,它还能直接文字生成视频,进行各种角色混合和动作替换...其核心技术基于 JST1 模型。JST1 是首个具有实际物理理解能力的视频3D 基础模型,能够根据用户的需求,让任何角色按照指定的方式进行运动。核心功能: 可控制的视频生成:用户可以通过文字描述指定角色的动作和场景的细节,Viggle 将根据这些指示生成视频。 基于物理的动画:JST1 模型的一个显著特点是其对物理原理的理解,这意味着生成的视频不仅看起来真实,而且角色的动作和互动符合实际物理规律。这提高了视频的质量和真实感。 3D 角色和场景创建:Viggle 不仅限于传统的 2D 视频制作,它还能够创建 3D 角色和场景。
2025-01-11
如何把静态的图片动起来
以下是一些可以将静态图片动起来的方法和工具: 1. 使用 VIGGLE 工具: Mix 模式:先上传一个视频和一张角色图像,Viggle 会自动将视频的动态赋予给这个角色,形成新视频。它能模拟出角色的 3D 状态,准确还原身体旋转、四肢交叠等动作,也可以利用现有的模版视频作为动作获取来源。 Multi 模式:通过视频的动作,将上传的多个角色进行识别并赋予动作,形成新视频。 Move 模式:将视频的动作直接映射在图片人物身上,实现“让静态图动起来”。 案例:,结合 Midjourney 制作图片。 2. LiveSketch:为素描“注入生命”,通过文本提示将静态素描动画化。 应用场景:FlipaClip 提供的服务方向+LiveSketche 可更便捷生成动画;简笔画替换成骨骼图+controlnet+帧图可生成动态漫;简笔画替换成骨骼图+runway 控制可生成动态视频。 技术特点:能够将单一主题的静态素描转换成动画,用户只需提供描述所需动作的文本提示,系统就会生成短动画。通过修改描述运动的提示文本,还可以控制生成结果的程度。 3. 使用 Camera Motion: 上传图片:点击“AddImage”上传图片。 输入提示词:在“Prompt”中输入提示词。 设置运镜方向:选择想要的运镜方向,输入运镜值。 设置运动幅度:运动幅度和画面主体运动幅度有关,与运镜大小无关,可设置成任意值。 其它设置:选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。 生成视频:点击“create”生成视频。
2024-12-03
静态动物图片,生成说话视频
以下是一些能够将静态动物图片生成说话视频的技术和相关信息: VividTalk:单张照片和一段音频可生成看似真实的说话视频,支持多种语言和风格,如真实和卡通风格,由南京大学、阿里巴巴、字节跳动和南开大学合作开发。链接:https://x.com/xiaohuggg/status/1732026172509421697?s=20 腾讯 AniPortrait:根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制,比阿里 EMO 项目先开源。链接:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20
2024-11-13
多模态Agent最新动态
以下是关于多模态 Agent 的最新动态: 《质朴发言:视觉语言理解模型的当前技术边界与未来应用想象|Z 研究第 2 期》 近期,生成式 AI 领域的浪潮催化了多模态模型的探索,研究人员不断尝试使用更多模态数据的编码,以训练出能够理解和处理多种类型数据的模型。本份研究报告集中讨论了基于 Transformer 架构的视觉语言模型,报告范围专注于视觉和语言之间的交互,不考虑单纯的视觉到视觉的计算机视觉任务。 从 2022 年 11 月 18 日到 2023 年 7 月 26 日,多模态 Agents 迅速增长。 LLM 多模态 agent 是将现有技术融合的新尝试,是一种集成了多种模态数据处理能力的 AI 技术。 优点:高度的灵活性和扩展性,可根据不同任务需求调用最合适的模型处理任务,适应多样化任务和数据类型,优化资源使用,提升效率;无需训练,系统开发周期快,成本低。 局限性:调试和工程化难度较高,维护和升级成本高;多个组件紧密耦合,单点故障可能导致整个系统风险增加;没有涌现出新的能力。 适用场景:需要综合处理视频、语音和文本等多种信息的复杂环境,如自动驾驶汽车;高度交互和灵活的用户界面,如客户服务机器人或交互式娱乐应用。 《2024 年度 AI 十大趋势报告》 随着大模型对图像和视频信息的处理能力快速提升,预计 2025 年将开始出现更为综合性的多模态交互,AI 能够通过物联网、特定信息等多种感知通道进行协同。 多模态输入和输出使 AI 交互性更强、交互频次更高,适用场景也更加丰富,AI 产品整体水平显著提升。 Agent 作为融合感知、分析、决策和执行能力的智能体,能够根据用户历史行为和偏好,主动提供建议、提醒并个性化执行能力,为用户提供高度个性化的任务。从 2025 年开始,AI Agent 即将广泛投入使用。 从个性化推荐到直接生成个性化内容,AIGC 能够使用户体验的个性化程度有明显提升,这将帮助产品进一步完善用户体验,并通过提高用户忠诚度和迁移成本,实现差异化定价和进一步的服务增值,对产品的差异化竞争有重大意义。目前,基于 AIGC 的高度个性化已经在 AI 教育、AI 陪伴、AI 营销领域有明显进展。在硬件端搭载的多款 AI 智能助手也已开始以高度个性的个人助理作为宣传重点。
2025-03-31
现在是2025年3月18日,我现在要整理一份AI行业的最新动态,在每天早上十点发布,请你整理今天的最新动态,10条左右
以下是 2025 年 3 月 18 日 AI 行业的最新动态: 1. 3 月 AI 发展持续升温。 2. 3 月潞晨科技发布 OpenSora。 3. 3 月 Suno 发布 V3 版本爆火。 4. OpenAI CPO Kevin Weil 访谈亮点:GPT5 近在眼前,将融合多个模型能力,快速推进,AI 代码自动化将在今年内达到 99%,强化推理能力和大规模预训练是关键方向,AI 不仅会写代码,还将让人人都能成为软件创造者。 5. 2025 年职场思考与建议:高管们面临“经验贬值”与“转型焦虑”,非 AI 公司的估值与融资变难,软件开发方式正被重构,“等风来”的代价越来越高,加入 AI 公司也并非万能,市场冷却下招聘更挑剔。 6. 你的孩子可能已经在用 AI“作弊”。 7. 过去一年,头部 AI 应用的品类变化不显著,创意工具仍占据最大比重。 8. 2024 年 9 月,OpenAI 发布新一代语言模型 o1,采用全新训练与推理方案,结合强化学习技术,显著增强推理能力,可能通过生成内部“思维链”模拟人类系统 2 思维方式。 9. 5 月伊莉雅离开 OpenAI,AI 竞争白热化。 10. 5 月伊利亚成立新公司,估值超五亿美金。
2025-03-18
最新的AI技术动态
以下是关于最新的 AI 技术动态的相关内容: AI 技术的学习路径: 偏向技术研究方向: 数学基础:线性代数、概率论、优化理论等。 机器学习基础:监督学习、无监督学习、强化学习等。 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:语言模型、文本分类、机器翻译等。 计算机视觉:图像分类、目标检测、语义分割等。 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 编程基础:Python、C++等。 机器学习基础:监督学习、无监督学习等。 深度学习框架:TensorFlow、PyTorch 等。 应用领域:自然语言处理、计算机视觉、推荐系统等。 数据处理:数据采集、清洗、特征工程等。 模型部署:模型优化、模型服务等。 行业实践:项目实战、案例分析等。 2024 年 AI 大事纪: 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 AI 技术的发展历程和前沿技术点: 发展历程: 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 前沿技术点: 大模型(Large Language Models):GPT、PaLM 等。 多模态 AI:视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-16
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12
如何把图片生成动态立体图
目前在将图片生成动态立体图方面,相关技术和方法还在不断发展和探索中。常见的途径可能包括使用专业的图形设计软件,如 3D 建模工具,通过对图片进行深度分析和建模来实现动态立体效果。但具体的操作过程会因软件的不同而有所差异。另外,一些新兴的 AI 图像生成技术也可能在未来为这一需求提供更便捷的解决方案。
2025-03-05
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17