Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

可灵是什么

Answer

“可灵”是快手发布的视频大模型,具有以下特点:

  • 能够生成超过 120 秒的 1080P 视频。
  • 模拟真实物理特性,如重力、光影反射、液体流动等。
  • 准确建模复杂运动场景,包括高速奔跑的动物、月球行走的宇航员等。
  • 画面连贯,动作流畅,细节真实。
  • 支持用户输入控制信息,丰富内容控制能力。
  • 采用类 Sora 的 DiT 结构,用 Transformer 代替卷积网络。
  • 自研 3D VAE 网络,提升视频重建质量。

其官网链接为 https://kling.kuaishou.com/mobile。

Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?Xiaohu.AI日报「6月7日」 ✨✨✨✨✨✨✨✨1⃣️?快手发布“可灵”视频大模型:生成超过120秒1080P视频模拟真实物理特性(重力、光影反射、液体流动等)准确建模复杂运动场景(高速奔跑的动物、月球行走的宇航员等)类Sora的DiT结构,用Transformer代替卷积网络自研3D VAE网络,提升视频重建质量? https://xiaohu.ai/p/9119? https://x.com/imxiaohu/status/17989160290638522752⃣️?Chatwiz:AI虚拟女朋友:高度还原真实对话包含6个角色,对话非常丝滑字节旗下产品在线体验:https://chatwiz.cn/h5/feely/landing? https://xiaohu.ai/p/9185? https://x.com/imxiaohu/status/17990728566279663903⃣️?️Canvastique3D与Illumetry合作开发3D预览工具:实时查看物品的全息投影可切换颜色和面料减少退货需求? https://x.com/imxiaohu/status/17990081324229305994⃣️?StreamSpeech:实时语言翻译模型:

XiaoHu.AI日报

?Xiaohu.AI日报「6月7日」 ✨✨✨✨✨✨✨✨1⃣️?快手发布“可灵”视频大模型:生成超过120秒1080P视频模拟真实物理特性(重力、光影反射、液体流动等)准确建模复杂运动场景(高速奔跑的动物、月球行走的宇航员等)类Sora的DiT结构,用Transformer代替卷积网络自研3D VAE网络,提升视频重建质量? https://xiaohu.ai/p/9119? https://x.com/imxiaohu/status/17989160290638522752⃣️?Chatwiz:AI虚拟女朋友:高度还原真实对话包含6个角色,对话非常丝滑字节旗下产品在线体验:https://chatwiz.cn/h5/feely/landing? https://xiaohu.ai/p/9185? https://x.com/imxiaohu/status/17990728566279663903⃣️?️Canvastique3D与Illumetry合作开发3D预览工具:实时查看物品的全息投影可切换颜色和面料减少退货需求? https://x.com/imxiaohu/status/17990081324229305994⃣️?StreamSpeech:实时语言翻译模型:

视频模型:可灵

[快手【可灵】大模型介绍PPT](https://waytoagi.feishu.cn/wiki/S1Mswi9PUiV2lskKmutcpzuynfd)生成超过120秒1080P视频模拟真实物理特性(重力、光影反射、液体流动等)准确建模复杂运动场景(高速奔跑的动物、月球行走的宇航员等)画面连贯,动作流畅,细节真实支持用户输入控制信息,丰富内容控制能力类Sora的DiT结构,用Transformer代替卷积网络自研3D VAE网络,提升视频重建质量官网链接https://kling.kuaishou.com/mobile小互报导:? https://xiaohu.ai/p/9119? https://x.com/imxiaohu/status/1804030672836923554大聪明的技术详解中学生能看懂:快手「可灵」和「Sora」背后DiT技4术https://mp.weixin.q2q.com/s/2PrMgNAL0Er_vNjhqSbTHQ

Others are asking
可灵api
ComfyUI GeminiAPI 相关内容如下: 用途:用于在 ComfyUI 中调用 Google Gemini API。 安装说明: 手动安装: 1. 将此存储库克隆到 ComfyUI 的 custom_nodes 目录。 2. 安装所需依赖: 如果使用 ComfyUI 便携版。 如果使用自己的 Python 环境。 通过 ComfyUI Manager 安装: 1. 在 ComfyUI 中安装并打开 ComfyUI Manager。 2. 在 Manager 中搜索“Gemini API”。 3. 点击安装按钮,安装完成后重启 ComfyUI。 节点说明: Gemini 2.0 image:通过 Gemini API 生成图像的节点。 输入参数: prompt(必填):描述想要生成的图像的文本提示词。 api_key(必填):Google Gemini API 密钥(首次设置后会自动保存)。 model:模型选择。 width:生成图像的宽度(512 2048 像素)。 height:生成图像的高度(512 2048 像素)。 temperature:控制生成多样性的参数(0.0 2.0)。 seed(可选):随机种子,指定值可重现结果。 image(可选):参考图像输入,用于风格引导。 输出: image:生成的图像,可以连接到 ComfyUI 的其他节点。 API Respond:包含处理日志和 API 返回的文本信息。 使用场景: 创建独特的概念艺术。 基于文本描述生成图像。 使用参考图像创建风格一致的新图像。 基于图像的编辑操作。 API key 获取:在 Google 的 AI Studio 申请一个 API key(需要网络环境),有免费的额度,访问 https://aistudio.google.com/apikey?hl=zhcn 。 温度参数说明:温度值范围为 0.0 到 2.0,较低的温度(接近 0)生成更确定性、可预测的结果,较高的温度(接近 2)生成更多样化、创造性的结果,默认值 1.0 平衡确定性和创造性。 注意事项: API 可能有使用限制或费用,请查阅 Google 的官方文档。 图像生成质量和速度取决于 Google 的服务器状态和您的网络连接。 参考图像功能会将您的图像提供给 Google 服务,请注意隐私影响。 首次使用时需要输入 API 密钥,之后会自动存储在节点目录中的 gemini_api_key.txt 文件中。
2025-04-14
可灵AI近期有哪些重大更新
快手 AI 产品“可灵”近期的重大更新如下: 1. 今年 6 月,凭借“让老照片动起来”、“让照片中的人拥抱”等热点在互联网爆火,以高质量视频效果、低价格和良心免费额度获好评。 2. 9 月更新了 1.5 模型能力,使视频的画面表现力、提示词理解能力、画面清晰度大幅提升,位列视频生成产品第一梯队。 1.0 模型生成一次视频消耗 10 灵感值,1.5 模型消耗 35 灵感值。 免费用户每日免费享 66 灵感值,付费用户享有 1.5 模型、去水印、高清晰度视频生成、视频延长能力、大师运镜、AI 生图画质增强能力。 增加了运动笔刷控制。 1.5 模型在画面表现力、提示词理解能力上有大幅提升,改善了此前将相机运动描述当作实物生成的问题,但视频中文本内容生成仍有待改进。 3. 移动端 APP 为快影,网页版访问地址为:https://klingai.kuaishou.com/ ,使用指南:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxpsection=h.j6c40npi1fan 。 4. 传统 txt2vid、img2vid 以外,还支持首尾帧控制、延长视频、对口型能力。txt2vid 模式下支持运镜控制,普通用户可使用水平/垂直运镜、推进/拉远、垂直/水平摇镜;另有四种大师运镜仅付费用户可用。
2025-04-08
可灵视频提示词怎么写
以下是关于可灵视频提示词的写法: 1. 上传基础视频: 点击页面下方的【Pikaddition】按钮。 拖拽或点击上传本地视频。 若自己没有视频,可在“templates”板块使用官方示例视频做测试。 2. 添加主角图片:点击【Upload Image】上传角色图片文件。 3. 编写视频提示词: 若需要参考角色在视频里的相关互动,需在输入框用英文描述期望效果(支持 Emoji 辅助),然后点击生成按钮。 Pika 会提供一段默认 prompt,若无特殊想法,可直接使用。 建议在自己的提示词尾部加入官方提供的默认提示词,效果会更好。 提示词公式参考: 事件驱动句式:As... 空间锁定技巧:使用场景物体作坐标轴:on the.../behind the.../from the... 动态呼应原则:角色动作与视频元素联动:swaying with.../reacting to.../matching... 核心逻辑:Pikadditions 的核心功能是用户上传实拍视频和角色图片,AI 将角色动态融入视频中。因此,提示词需要具体描述角色在视频中的动作、互动和场景匹配。 此外,对于 Adobe Firefly 的提示词技巧: 明确且具体描述,尽量使用更多词汇来具体描述光线、摄影、色彩、氛围和美学风格。 提示词公式:镜头类型描述+角色+动作+地点+美学风格。 镜头类型描述:相机的视角是什么?它是如何移动的?示例:“一个特写镜头,缓慢推近。” 角色描述:角色是谁?他们长什么样子?他们穿着什么?他们的情绪如何?示例:“一只体型庞大的北极熊,拥有明亮的白色毛皮,看起来若有所思。” 动作:角色在场景中做什么?示例:“北极熊正轻柔而自信地走向它之前在冰面上打开的一个洞,准备在冰面下捕猎。” 地点:角色在哪里?天气如何?地形是怎样的?示例:“地点是一片荒凉的雪地;远处灰蒙蒙的云朵缓慢移动。” 美学风格:这是什么类型的镜头?氛围是怎样的?景深如何?示例:“电影感、35mm 胶片、细节丰富、浅景深、散景效果。” 构建提示词时,建议限制主题数量,过多的主题(超过四个)可能会让 Firefly 感到困惑。
2025-03-12
可灵ai是什么
可灵 AI 是一款视频生成类的产品,其网址为 klingai.kuaishou.com,所属公司为快手。在第 34 期“Video Battle 视频挑战赛 The Moment”中,由可灵 AI 出题,主题为“The Moment”,要求以该主题进行创作,工具要求使用可灵 AI,视频需带可灵水印。参赛有诸多限制和要求,如提交时间为 12 月 31 日 21:00 前,参赛文件格式为 16:9、不长于 10 秒、30FPS 以上且不含剪辑,作业方式不限等。奖项设置包括金奖 5000 元 + 5800 灵感值、银奖 3000 元 + 2700(2200 + 500)灵感值、铜奖 2000 元 + 1000 灵感值、入围 500 元×40、人气奖 2500 元×4 以及其他意外散落的灵感值。
2025-03-09
我想学习可灵ai的提示词
以下是一些关于可灵 AI 提示词的相关资源和信息: 提示词模板相关网站: 生成新年场景的提示词示例: 戴着醒狮帽,双手抱拳,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 拿着"福"字,新年气氛,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 关于律师如何写好提示词用好 AI 的观点: 不能期待设计一个完美的提示词,然后 AI 百分百给到一个完美的符合要求的答案,中间不能有谬误,否则就是一个需要修复的“BUG”。 要给到 AI 的提示词实际上是一个关于此项问题的相对完善的“谈话方案”,真正的成果需要在对话中产生,并且在对话中限缩自己思维中的模糊地带。
2025-02-16
可灵AI视频好用吗
可灵 AI 视频具有以下特点和优势: 1. 今年 6 月爆火,凭借“让老照片动起来”等热点刷了一波好感。9 月更新 1.5 模型能力,使视频的画面表现力、提示词理解能力、画面清晰度上了一个台阶,位列视频生成产品第一梯队。 2. 现阶段免费用户每日免费享 66 灵感值,1.0 模型生成一次视频消耗 10 灵感值,1.5 模型则消耗 35 灵感值。付费用户享有 1.5 模型、去水印、高清晰度视频生成、视频延长能力、大师运镜、AI 生图画质增强能力。 3. 移动端 APP 为快影,网页版访问地址为:https://klingai.kuaishou.com/ ,使用指南:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxpsection=h.j6c40npi1fan 。 4. 除传统 txt2vid、img2vid 外,还支持首尾帧控制、延长视频、对口型能力。txt2vid 模式下支持运镜控制,普通用户可使用水平/垂直运镜、推进/拉远、垂直/水平摇镜;另有四种大师运镜仅付费用户可用。9 月中,在 1.0 模型中增加了运动笔刷控制。 5. 1.5 模型能力在画面表现力、提示词理解能力上有大幅提升,改善了此前会将相机运动描述当作实物生成的问题,但视频中文本内容生成还做不到。 6. 在评测中,优势在于运动幅度较大,能产生惊喜效果,但在视频清晰度、语义理解、画面表现力上,1.0 比 Runway、Luma 的最新模型弱很多,1.5 进步明显,达到付费产品水平。 在 AI 视频生成领域,可灵的优势主要体现在: 1. 卓越的视频生成质量,在画面清晰度、连贯性、内容丰富性上,达到与国际顶级模型相当的水准,满足普通用户和专业创作者需求。 2. 生成速度表现出色,处理效率高于国外同类产品,能提升用户工作效率。 3. 对于国内用户,可访问性强,提供便捷、稳定的使用体验,降低使用门槛。 此外,快手于 6 月发布“可灵”视频大模型,能生成超过 120 秒 1080P 视频,模拟真实物理特性,准确建模复杂运动场景,采用类 Sora 的 DiT 结构,用 Transformer 代替卷积网络,自研 3D VAE 网络提升视频重建质量。
2025-02-01