Navigate to WaytoAGI Wiki →
Home/All Questions
学习AI小说写作
以下是关于学习 AI 小说写作的一些方法和建议: 1. 利用 coze 工作流: 用 bing 搜索相关标题的内容。 用程序将搜索结果结构化(不熟悉程序的可忽略或直接复制文中代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型来写文章并输出文章内容。 2. 基于《救猫咪》的工作流: 记住 AI 只是辅助创作,提高创作效率,最后仍需人工加工和修改以满足人类读者要求。 可使用的 AI 工具有 ChatGPT(擅长构思)、Claude(文笔好于 ChatGPT)、彩云小梦、Kimi、MidReal 等。 3. DeepSeek 小说家相关: 从 Deepseek R1 提示词过渡到小说写作,探讨如精心设计与凭直觉写作的关系。 考虑好文字引起的生理和情绪共鸣,关注人类共性。 交流模型应用和创作,如对比 Deepseek 和 cloud 3.5 文风,控制篇幅方法等。 参与如“Deepseek 小说家”等相关活动,分享经验和案例。
2025-03-11
张翼然:AI赋能教育,创新引领未来
以下是关于“张翼然:AI 赋能教学,创新引领未来”的相关内容: AI 赋能教学创新引领未来,涉及以下方面: 1. AI 与人类智能的共生,放大学生思考力,塑造深度学习能力。 2. 从易到难的学习路径包括:了解 AI 工作原理、尝试各种 AI 工具、学会优化提示词、生成课程资源、解决教学场景、课上师生机共学、促进学生正确使用、提升人机共创力。 3. 教学主要负担分析,如备课压力(编写教案、制作课件、设计教学方案)、适应新课标等。 4. 列举了一些 AI 解决方案,如用通义听悟整理录音笔记、用 AI 配字幕等,还包括相关网站和案例。 5. 强调 AI 是智慧的助手而非替代品,真正的教育创新源于教师的专业判断、教学智慧与创造力的融合。 张翼然为湖南农业大学教育技术系副教授,是“人工智能+教育”实践专家,长期关注新技术及教育应用,探讨 AI 赋能教师的具体方法。其成果包括国家教学成果奖,国家级和省级精品在线课程。
2025-03-11
在国内,制作AI视频,可用什么工具
在国内制作 AI 视频,可用以下工具: 1. 魔音工坊:可以使用情绪调节控件。 2. 剪映:适用于 1 3 分钟的短片,具有很多人性化设计及简单音效库、小特效,但无法协同工作和导出工程文件。 3. 以下是一些其他的相关工具及网站: SVD:https://stablevideo.com/ ,对于景观更好用。 Morph Studio:https://app.morphstudio.com/ ,还在内测。 Heygen:https://www.heygen.com/ ,数字人/对口型。 Kaiber:https://kaiber.ai/ Moonvalley:https://moonvalley.ai/ Mootion:https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 美图旗下:https://www.miraclevision.com/ Neverends:https://neverends.life/create ,操作傻瓜。 SD:Animatediff SVD deforum ,需自己部署。 Leiapix:https://www.leiapix.com/ ,可以把一张照片转动态。 Krea:https://www.krea.ai/ Opusclip:https://www.opus.pro/ ,利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com veed.io:https://www.veed.io/ ,自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ typeframes:https://www.revid.ai/?ref=aibot.cn Runway:https://runwayml.com ,有网页有 app 方便。 即梦:https://dreamina.jianying.com/ ,剪映旗下,生成 3 秒,动作幅度有很大升级,最新 S 模型,P 模型。 Minimax 海螺 AI:https://hailuoai.video/ ,非常听话,语义理解能力非常强。 Kling:kling.kuaishou.com ,支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。 Vidu:https://www.vidu.studio/ haiper:https://app.haiper.ai/ Pika:https://pika.art/ ,可控性强,可以对嘴型,可配音。 智谱清影:https://chatglm.cn/video ,开源了,可以自己部署 cogvideo。 PixVerse:https://pixverse.ai/ ,人少不怎么排队,还有换脸功能。 通义万相:https://tongyi.aliyun.com/wanxiang/ ,大幅度运动很强。 luma:https://lumalabs.ai/
2025-03-11
根据文本提示生成图像
以下是关于根据文本提示生成图像的相关内容: Comfyui Playground2.5: 模型地址:https://civitai.com/models/325263/playgroundaisplaygroundv251024px ,https://huggingface.co/playgroundai/playgroundv2.51024pxaesthetic/tree/main 。 该模型根据文本提示生成图像,是一个使用两个固定的、预训练的文本编码器(OpenCLIPViT/G 和 CLIPViT/L)的潜在扩散模型,遵循与 Stable Diffusion XL 相同的架构(底层框架是 SDXL),风格化较强,CGF 的权重不要给太高。 默认使用 EDMDPMSolverMultistepScheduler 调度程序,以获得更清晰的细节,guidance_scale=3.0 是一个很好的默认值;EDMEulerScheduler 调度程序,guidance_scale=5.0 是一个很好的默认值。 需要 EDM 采样算法,这是一种在扩散模型中使用的高效采样方法,通过优化采样过程,减少生成图像所需的步骤,加快图像生成速度。 Midjourney: 文本描述是 Midjourney 中最重要的出图逻辑,在输入框中输入「/image+文本描述」来生成图像。 操作方法:若要生成 B 端界面,先清楚 B 端产品的关键词,如输入「SaaS dashboard」可得深色 B 端界面效果,加入“白色背景”描述可生成简约浅色的 B 端界面,还可尝试其他颜色。Midjourney 会默认给出 4 张图像,图像下有两行按钮,第一行的 U 是放大图像提升细节,第二行的 V 是在基础上发生变化。 使用分析:文本描述操作便捷,但对于新手可能存在无法准确描述所需关键词提示或生成图像与预想效果不一致的问题,可能调整关键词的前后顺序或增删字都会对结果产生很大影响,导致产生很多废稿。 OpenAI: 图像生成端点允许您在给定文本提示的情况下创建原始图像,生成的图像大小可为 256x256、512x512 或 1024x1024 像素,较小的尺寸生成速度更快。可使用 n 参数一次请求 110 张图像,描述越详细越可能获得想要的结果,可探索 DALL·E 预览应用程序中的示例获取更多提示灵感。 图像编辑端点允许您通过上传蒙版来编辑和扩展图像,遮罩的透明区域指示应编辑图像的位置,提示应描述完整的新图像,上传的图片和遮罩必须是小于 4MB 的正方形 PNG 图片,且尺寸相同。
2025-03-11
如何制作AI视频
将小说制作成 AI 视频通常包括以下步骤,并可使用以下工具: 工具与网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。 网址:https://github.com/StabilityAI 2. Midjourney(MJ):适用于创建小说中的场景和角色图像。 网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。 网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址:https://www.aihub.cn/tools/video/gushiai/ 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,以冷湖《俄博梁纪元》AI 视频为例,其片头框架基本逻辑是:需要视线聚焦到中心的圆形细胞,并保持固定,方便后续画面的转场。由于单张 AI 图生视频的动效太简单,可分几个图层进行处理,还可叠加几个画面来丰富画面。
2025-03-11
文生图
以下是关于文生图的详细教程: 定主题:明确您需要生成的图片的主题、风格以及要表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看的帖子中使用的 lora。 ControlNet:可控制图片中特定的图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 设置 VAE:通常选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,无需考虑语法,单词、短语间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选择 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选择 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图工具: 腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-03-11
mp3音频转文本的AI应用有哪些
以下是一些可以将 MP3 音频转文本的 AI 应用: 1. 语音转文本(Speech to text): 提供两个端点,即基于先进的开源大型v2 Whisper 模型的转录和翻译。 可用于将音频转录为任何语言,将音频翻译并转录成英语。 文件上传限制为 25MB,支持 MP3、MP4、MPEG、MPGA、M4A、WAV 和 WebM 等输入文件类型。 转录 API 的输入是音频文件及所需输出格式的音频文字稿,默认响应类型为包含原始文本的 JSON,可通过添加更多带有相关选项的form 行设置其他参数。 2. 海螺 AI 声音克隆: 能嵌入完整的 AI 录视频工作流中。 可将 MP4 视频转为 MP3 音频文件,然后将音频上传至通义听悟(或其他工具如飞书妙记)生成文字稿。 需要注意的是,在语音转文字过程中可能会遇到语音识别不准的问题,可使用 Gemini 2.0 Pro 等工具进行优化校正。
2025-03-11
AI音乐的工程文件如何获取
以下是获取 AI 音乐工程文件的一些方法: 1. 参考自媒体链接【用 AI 生成并发行自己的音乐哔哩哔哩】https://b23.tv/ouHfhfM 中的教程。其中提到: 导出时间轴歌词:使用剪映,其相关功能位置可参考视频中的介绍。 音乐分轨:可使用腾讯 QQ 音乐旗下的 TME Studio,网站链接为 https://y.qq.com/tme_studio/,支持一键分轨并导出全部音频文件。 对于没有编曲经验的小白,可以通过电脑录屏工具录制歌曲的工程文件来提供创作证明。 2. 生成 MID 文件: 把源文件放在 input 文件夹(支持 MP3,WAV),可以直接用 vs code 运行 start.py,也可以右键点击文件夹空白,打开 Powershell 窗口输入在 cmd 环境运行。 原始的 start.py 代码里是默认 cuda 运行的,如果用 cpu 跑,需把里面的 cuda 改成 cpu。转谱完成后,在 output 文件夹找到对应的 mid 文件。 检查乐谱时,目前测试下来主旋律基本能还原,但可能存在噪声被识别成音符等错误,需要具备一定乐理知识去修复。 重奏输出可使用修谱和重奏软件 Musehub 中的 Muse Score,支持导出多种常用音频编辑格式和高清输出。 3. 通过 Coze 应用获取: 创建一个 Coze,在“用户界面”拖入一个 markdown 组件。 在 markdown 中写入 html,对于不懂前端的同学可使用智谱清言等 AI 工具生成源码。 调整代码获取在线音乐,将 markdown 自带内容删除,写入代码,再从在线音乐播放平台获取歌曲的 url 复制进代码,刷新开发页面即可。
2025-03-11
AI音乐发布要准备哪些材料
发布 AI 音乐通常需要准备以下材料: 1. 音频文件:确保音频质量良好。 2. 歌词: 文本歌词需做成 TXT 格式上传。 可通过自带功能将文本歌词同步为逐字歌词 TRC,修正错别字后提交。 3. 描述音乐风格:如民谣、流行、嘻哈、国风等。 4. 若为人声歌曲,还需准备歌词:可以自己创作,也可让 AI 帮忙写作。 5. 选择音乐库中的合适音乐。 此外,在一些相关教程中还提到: 收藏过的满意音乐素材、音效素材以及抖音里收藏的音乐。 音效库方面,可通过搜索相应音效,如开门声,并添加到音轨。
2025-03-11
AI+小游戏开发
以下是关于 AI+小游戏开发的相关信息: AI 在游戏开发中的应用具有悠久历史,且不断发展。如今,大模型等关键技术的进步使 AI 能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 在游戏行业的渗透有诸多优势,包括游戏开发者乐于使用 AI 技术、游戏数据降低了筛选和清洗成本以及游戏成为 AI 模型能力的最佳试验场。 AI 对游戏创作的革新是工业级的,可从美术与风格、剧情与叙事、音效与音乐、玩法与机制、测试与优化这 5 个方面简化游戏创作的工作流。 例如,一款名为 Proxima 的 5 人独立游戏工作室开发的 AI 冒险独立游戏 Suck Up! 就引入了名为 Nemo 的 AI NPC,基于 LLM 驱动,能够根据用户命令或线索执行游戏行动。该游戏上线三周在油管播放超千万,其核心玩法与世界观设计得到了一定的市场验证,玩家还共创了许多富有创意的支线玩法和模式。 此外,AI 技术在游戏开发中的应用逐渐落地,为游戏行业提供了新的增长空间。2023 年我国游戏市场实际销售收入为 3029.6 亿人民币,同比增长 13.95%;截至 2024 年 11 月,累计收入已达 2681.16 亿元,市场回暖力度加强。同时,中国游戏用户规模也有所增长。
2025-03-11