Chat with Wiki - WayToAGI

视频生成是当前 AIGC 领域的一个重要方面，以下是关于视频生成的详细介绍：一、AIGC 概述中的视频生成以生成方式划分，当前视频生成可分为文生视频、图生视频与视频生视频。视频生成涉及深度学习技术，如 GANs 和 Video Diffusion，现在的主流生成模型为扩散模型（Diffusion model）。视频生成可用于娱乐、体育分析和自动驾驶等各种领域。视频生成经常与语音生成一起使用。用于语音生成的模型可以由 Transformers 提供，可用于文本到语音的转换、虚拟助手和语音克隆等。这类 Generative AI 用于生成音频信号，常用的技术包括循环神经网络（RNNs）、长短时记忆网络（LSTMs）、WaveNet 等。二、具有代表性的海外项目 1. Sora（OpenAI）：以扩散 Transformer 模型为核心，能够生成长达一分钟的高保真视频。支持文本生成视频、视频生成视频、图像生成视频，被定位为世界模拟器，在文本理解方面有出色表现，还能在单个生成的视频中创建多个镜头，保留角色和视觉风格。 2. Genie（Google）：采用 STtransformer 架构，包括潜在动作模型、视频分词器与动力学模型，拥有 110 亿参数，被定位为基础世界模型，可通过单张图像提示生成交互式环境。 3. WaveNet（DeepMind）：一种生成模型，可以生成非常逼真的人类语音。 4. MuseNet（OpenAI）：一种生成音乐的 AI 模型，可以在多种风格和乐器之间进行组合。 5. Multilingual v2（ElevenLabs）：一种语音生成模型，支持 28 种语言的语音合成服务。三、生成带有文本提示和图像的视频在 Advanced 部分，您可以使用 Seed 选项添加种子编号，以帮助启动流程并控制 AI 创建的内容的随机性。如果使用相同的种子、提示和控制设置，则可以重新生成类似的视频剪辑。选择 Generate 即可生成。四、PixVerse V2 的使用教程 1. 输入提示词：如无图片上传，可忽略上传图片步骤。 2. 选择视频时长：支持 5s 和 8s 的视频生成。 3. 添加新片段：在添加新片段模式下，所有 Scene 画面风格都会与 Scene 1 保持一致，如 Scene 1 有图片，则会参考 Scene 1 中的图片风格。添加 Scene 2：点击“Scene 1”旁边的“＋”，为视频添加第二个片段。编辑 Scene 2：在 Scene 2 中，您可以为 Scene2 输入不同于 Scene 1 的提示词，其它操作与之前相同。编辑其它 Scene：重复以上步骤，您可以为视频添加多个 Scene，最多支持 5 个 Scene 的同时生成。 4. 生成视频：点击图标生成视频。每次生成需要花费 30 Credits，且默认将所有片段拼接在一起，不支持单片段下载。 5. 编辑生成的视频：点击视频进入编辑页面。编辑视频：视频下方分别为角色、环境、动作。如生成的视频不满意，您可从相应的下拉选项中选择想要的效果。编辑多个 Scene：上方为进度条，通过点击切换 Scene，可一次性对多个 Scene 进行编辑后一起生成。生成视频：对所有 Scene 编辑完成后，点击“Create”，可重新生成视频。未修改的 Scene，再次生成时也会改变，不会与之前生成的视频保持一致。