Navigate to WaytoAGI Wiki →
Home/All Questions
lora怎么训练
以下是关于 Lora 训练的详细步骤: 创建数据集: 1. 进入厚德云模型训练数据集(https://portal.houdeyun.cn/sd/dataset)。 2. 在数据集一栏中,点击右上角创建数据集。 3. 输入数据集名称。 4. 可以上传包含图片+标签 txt 的 zip 文件,也可以只有图片后续使用自动打标功能。建议提前把图片和标签打包成 zip 上传,Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 5. 上传 zip 以后等待一段时间,确认创建数据集。返回到上一个页面,等待一段时间后就会上传成功,可以点击详情检查,预览到数据集的图片以及对应的标签。 Lora 训练: 1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集,点击右侧箭头,会跳出您所有上传过的数据集。 3. 触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 4. 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 5. 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 6. 然后等待训练,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。 7. 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 此外,还有一些相关的补充信息: 1. 训练前要确保下载几个模型:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。注意:不使用的话它们放到哪里都可以,甚至放一起一个文件夹,只要知道“路径”,后面要引用到“路径”。因为是训练,不是跑图,跑图可以寻求降低方案,训练的话,用 flux1dev.safetensors 这个版本,编码器用 t5xxl_fp16.safetensors 这个版本最好。 2. 下载脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 3. 安装虚拟环境:下载完解压,在文件中找到 installcnqinglong.ps1 这个文件,右键,选择“使用 PowerShell 运行”,新手的话这里就点击“Y”,然后等待 1 2 小时的漫长下载过程。下载完成后最后会提示是否下载 hunyuan 模型,选择 n 不用下载。 在使用 SD 训练一套贴纸 LoRA 模型时: 1. 原始形象:MJ 关键词:A drawing for a rabbit stickers,in the style of hallyu,screenshot,mori kei,duckcore plush doll art exaggerated poses,cry/happy/sad/...ar 3:4niji 5style cutes 180 。会得到不同风格的贴图,可以先看看自己喜欢哪一种。出图过程可以有意识地总结这一类贴图的特征,比如都是可爱的兔子、有不同的衣服和头饰、都有一双大大的卡通眼睛,会有不同的面部表情。 2. 注意事项:关键词中限制了颜色,因此 MJ 生成的图片会一种情绪对应一种颜色,所以同一种情绪最好多生成几张不同色系的,可以减少后续训练中模型把情绪和颜色做挂钩(如果需要这样的话,也可以反其道而行之)。数据集中正面情绪与负面情绪最好比例差不多,如果都是正面积极的,在出一些负面情时(sad,cry)的时候,可能会出现奇怪的问题(如我们训练的是兔子形象,但 ai 认知的 sad 可能是人的形象,可能会出现人物特征)。如果训练 256256 大小的表情包,这样的素材就已经够用了。如果要训练更高像素的图片,则需要进一步使用 MJ 垫图和高清扩展功能。比如从 256 高清化到 1024,输入左图,加入内容描述,加入风格描述,挑选合适的,选出新 30 张图片(卡通二次元类型的 lora 训练集 30 张差不多,真人 60 100 张)。
2025-03-06
教我如何使用剪辑视频ai
以下是使用剪辑视频 AI 的方法: 1. 准备视频内容: 先准备一段视频中播放的内容文字,内容可以是产品介绍、课程讲解、游戏攻略等。也可以利用 AI 生成这段文字。 2. 制作视频: 使用剪映 App 进行简单处理。电脑端打开剪映 App,点击“开始创作”。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 在界面右侧将准备好的文字内容替换默认文本内容,这将为数字人提供语音播放的内容以及生成相对应的口型。 3. 视频转绘处理(使用 Topaz Video AI 插件): 解压对应文件,推荐使用绿色版。右键管理员运行 VideoAIportable.exe 文件。 导入处理好的视频,查看主界面,左边是原视频,右边是待处理视频,下面是对应的视频轨道。 右边部分是对视频处理的方式,预设部分包括放大视频、提升画质、提升帧率等。稳定 AI 模式选择完整帧,强度在 60 左右,抖动开启,次数选择 2 保持默认不变。 4. 配音处理: 把鼠标移动到每个视频片段的右下角的蓝色“+”号,点击或拖拽将片段添加到剪映编辑器的轨道里。 点击剪映电脑版最上面的菜单栏“音频”。 音频导入包括直接导入音频文件(如 MP3 格式),支持视频转音频,还可以通过复制抖音视频的分享链接来获取音乐。
2025-03-06
教我如何使用DeepSeek
以下是关于如何使用 DeepSeek 的详细介绍: 1. 在网页端使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白之后,正式开始对话。 2. 获取字节火山 DeepSeek 系列 API 的使用方法: 可以先用邀请码:D3H5G9QA。 邀请链接:https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 。 操作指引:点击邀请,复制邀请链接,复制链接/邀请码 D3H5G9QA 或下载邀请海报分享给好友即可。 3. 在阿里云使用百炼满血版 DeepSeek: 阿里云百炼地址:https://bailian.console.aliyun.com/ 。 开通满血版 R1 模型:在模型广场找到 DeepSeekR1 并授权,页面上可看到免费的 100 万额度和已使用量,每人免费送 100 万额度,过期则亏。用完还有免费的蒸馏版的 R1 模型,也是 100 万 token。这些模型可在“首页”或者“直接体验”直接使用,也可通过 API 调用,如 chatbox 直接使用。 百炼应用开发:新增加了模板,可从模板学习应用搭建。 联网搜索:像知识库检索一样进行联网搜索,简单方便,直接配置即可用。结合 Deepseekr1 会更强大,搜索天气时会多方验证。 新鲜的动态 few shot:小技巧,可用于模型对于某些做不好、容易出幻觉的任务,通过 prompt training 进行强行修正。 工作流:用工作流让不同模型在同一任务创作。
2025-03-06
请解释一下AGI是什么意思
AGI 指的是通用人工智能(Artificial General Intelligence),它是一种能够像人类一样思考、学习和执行多种任务的人工智能系统。 例如,OpenAI 致力于研发实现 AGI 的技术,像 GPT 系列模型在某种程度上是朝着 AGI 迈出的巨大一步。人类在不断创新,从电力、晶体管、计算机、互联网,到很快可能出现的 AGI,每一代新的工具都推动着世界的进步。在未来,AGI 可能会让人们的生活在各方面获得极大的改善,比如治愈所有疾病、有更多时间陪伴家人以及充分发挥创造潜能等。
2025-03-06
现在国内最强大的ai是什么
目前国内较为强大的 AI 模型有: 智谱推出的 GLM 系列,一直是国内能力较好的模型之一。 MiniMax 推出的基于 MoE 架构的新模型,以及“星野”这个目前国内较成功的 AI 陪聊 APP。 月之暗面在长 Token 能力和记忆力方面表现可圈可点。 百度的“文心 4.0”是当前国内能力较好的模型之一。 即将发布的阿里的“通义千问”。 需要注意的是,在 2023 年官宣 AI 大模型的公司众多,其中不乏蹭流量的。从产品层面看,2C 端真正出圈的“妙鸭相机”也只是昙花一现。大多数消费者对 AI 产品的态度是“猎奇”而非刚需。在 2B 行业中,大模型目前还是“纯技术投入”,对于收入撬动非常有限。另外,国内在硬件层上仍存在卡脖子问题,目前国内仍然没有芯片可以胜任大模型训练,不过在推理上已经开始有 Nvidia 的替代产品逐渐出现。同时,中国的一些模型如由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得了优异的成绩,尤其在数学和编程方面表现出色,且各有优势。
2025-03-06
现在国内最强大的ai是什么
目前国内较为强大的 AI 模型有: 智谱推出的 GLM 系列,一直是国内能力较好的模型之一。 MiniMax 推出的采用 MoE 架构的新模型,以及“星野”这个目前国内较成功的 AI 陪聊 APP。 月之暗面在长 Token 能力和记忆力方面表现可圈可点。 百度的“文心 4.0”是当前国内能力较好的模型之一。 即将发布的阿里的“通义千问”。 同时,由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得了优异的成绩,尤其在数学和编程方面表现出色。中国的一些模型在某些方面能与美国的前沿模型竞争,并且更注重计算效率和数据集建设来弥补资源上的不足。但总体而言,国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。
2025-03-06
使用llm的爬虫工具推荐下,开源免费
以下是为您推荐的开源免费的使用 LLM 的爬虫工具: 1. Jina 开源的网页内容爬取工具:Reader API 能从网址提取出核心内容,并将其转化为干净、易于大语言模型处理的文本,确保为您的 AI 智能体及 RAG 系统提供高品质的数据输入。 2. Scrapy 库(Python 语言):在 crawlab 可以做到分布式爬取,非常高效。 3. GPT Crawler:主要运用 typescript 进行数据爬取。 4. 在开源的项目中,为实现对含有 JavaScript 内容的网页抓取,不使用 Python 自己的 request 库,而是使用 playwright 之类的浏览器,并将网页内容按照一定规则转化成 markdown 格式,方便 LLM 后续的理解和抓取。 同时,对于爬虫工具的选择,还需根据您的具体需求和技术熟悉程度来决定。
2025-03-06
coze
以下是关于 Coze 的相关信息: 重磅更新:Coze 可以接入抖音评论区,帮用户自动回复评论。若想快速上手,可参考视频。不知 Coze 是什么,可参考文章。 安装 Coze Scraper: 通过应用商店安装: 1. 打开 Chrome 浏览器。 2. 点击在 Chrome 应用商店中打开 Coze Scrapper 扩展程序。 3. 单击添加至 Chrome。 4. 在弹出的页面,单击添加扩展程序。 本地安装: 1. 单击下载安装包,然后解压下载的文件。 2. 打开 Chrome 浏览器。 3. 在浏览器中输入 chrome://extensions 打开扩展程序页面,确认开发者模式处于打开状态。点击加载已解压的扩展程序,选择已解压的文件夹。 Coze 记账管家: 什么是 COZE:字节跳动旗下子公司推出的 AI Agent 构建工具,允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent;目前可白嫖海量大模型免费使用,有丰富的插件生态。 什么是记账管家:基于 COZE 平台能力搭建的记账应用,可直接和 coze 说收入或支出情况,coze 会自动记账并计算账户余额,每一笔记账记录都不会丢失。点击以下卡片体验记账管家。
2025-03-06
如何写好提示词。
以下是关于如何写好提示词的相关内容: 1. 提示词用于描绘您想呈现的画面。星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),且支持中英文输入。启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。 2. 写好提示词的要点: 预设词组:小白用户可以点击提示词上方官方预设词组进行生图。 内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框。负面提示词可以帮助 AI 理解我们不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。也可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 编写提示词(prompt)的通用建议: 明确任务:清晰定义任务,如写故事时包含故事背景、角色和主要情节。 提供上下文:若任务需特定背景知识,提供足够信息。 使用清晰语言:避免模糊或歧义词汇。 给出具体要求:如有特定格式或风格要求,在提示词中明确指出。 使用示例:若有特定期望结果,提供示例。 保持简洁:避免过多信息导致困惑。 使用关键词和标签:帮助 AI 更好理解任务主题和类型。 测试和调整:生成文本后检查结果,根据需要调整提示词。 同时,提示词应清晰明确,避免模糊不清的指令。提供足够的背景信息和清楚的需求描述,以确保模型给出准确结果。您还可以通过以下链接获取更多信息:
2025-03-06
如何写好提示词。
以下是关于如何写好提示词的相关内容: 1. 提示词用于描绘您想呈现的画面。星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),且支持中英文输入。启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。 2. 写好提示词的要点: 预设词组:小白用户可以点击提示词上方官方预设词组进行生图。 内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框。负面提示词可以帮助 AI 理解我们不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。也可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 编写提示词(prompt)的通用建议: 明确任务:清晰定义任务,如写故事时包含故事背景、角色和主要情节。 提供上下文:若任务需特定背景知识,提供足够信息。 使用清晰语言:避免模糊或歧义词汇。 给出具体要求:如有特定格式或风格要求,在提示词中明确指出。 使用示例:若有特定期望结果,提供示例。 保持简洁:避免过多信息导致困惑。 使用关键词和标签:帮助 AI 更好理解任务主题和类型。 测试和调整:生成文本后检查结果,根据需要调整提示词。 同时,提示词应清晰明确,避免模糊不清的指令。提供足够的背景信息和清楚的需求描述,以确保模型给出准确结果。您还可以通过以下链接获取更多信息:
2025-03-06