Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如果让 ai 复刻《千里江山图》的局部细节,该如何写提示词

Answer

要让AI复刻《千里江山图》的局部细节,需要提供清晰、具体的指令,以确保AI能够理解并执行任务。以下是一些可能的提示词和步骤:

  1. 明确任务:首先,明确告诉AI你想要复刻的是《千里江山图》的哪个部分,例如:“请复刻《千里江山图》中的山水细节。”

  2. 详细描述:提供该局部细节的具体描述,包括颜色、纹理、风格等特征,例如:“重点复刻山峦的层次、水波的流动感以及树木的形态。”

  3. 风格指定:如果需要保持原作的风格,可以指定:“请保持宋代山水画的细腻笔触和深远意境。”

  4. 技术要求:如果需要特定的技术或效果,例如:“使用高精度的图像处理技术,确保细节的清晰度和真实感。”

  5. 尺寸和比例:指定复刻作品的尺寸和比例,例如:“复刻尺寸为原图的一半,保持原有比例。”

  6. 材料和工具:如果AI复刻作品需要使用特定的材料或工具,可以指定:“使用数字绘图板和高级绘画软件。”

  7. 质量标准:设定作品的质量标准,例如:“确保复刻作品的色彩和细节与原画高度一致。”

  8. 反馈和修正:如果AI可以进行交互,可以要求:“在复刻过程中,根据我的反馈进行必要的修正。”

  9. 版权和法律:提醒AI注意版权和法律问题,例如:“在复刻过程中,请确保遵守相关的版权法规。”

  10. 最终目标:明确复刻作品的最终目标,例如:“复刻的目的是为了艺术教育和展览,需要具有高度的艺术价值。”

结合以上提示,一个完整的提示词示例可能是: “请复刻《千里江山图》中山水细节部分,重点体现山峦层次、水波流动和树木形态,保持宋代山水画的细腻笔触和深远意境。使用高精度图像处理技术,确保细节清晰度和真实感。复刻尺寸为原图的一半,保持原有比例。使用数字绘图板和高级绘画软件,确保色彩和细节与原画高度一致。在复刻过程中,根据我的反馈进行修正,并确保遵守版权法规。复刻作品用于艺术教育和展览,需要具有高度的艺术价值。”

请注意,AI的复刻能力取决于其训练数据和算法的复杂性,可能无法完全达到人类艺术家的水平。

Content generated by AI large model, please carefully verify (powered by aily)

References

Tusiart简易上手教程

1.定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。2.选择基础模型Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。3.选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。4.ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。5.局部重绘:下篇再教,这里不急。6.设置VAE:无脑选择前面提到的840000这个即可。7.Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。

【SD】文生图怎么写提示词

接下来我们再增加一组反向提示词,可以告诉AI我们不要什么,在这里也是一组标准化提示词:NSFw,(最差质量:2),(低质量:2),(正常质量:2),(低质量:2),((单色)),((灰度)),皮肤斑点,痤疮,皮肤瑕疵,老年斑,(丑陋:1.331),(重复:1.331),(病态:1.21),(残缺:1.21),(变形:1.331),变异的手,(画得不好的手:1.5),模糊,(解剖不良:1.21),(比例不良:1.331),多余的四肢,(毁容:1.331),(缺胳膊:1.331),(多余的腿:1.331),(融合的手指:1.61051),(过多的手指:1.61051),(不清晰的眼睛:1.331),低质量,坏的手,缺手指,多余的手指,受伤的手,缺失的手指,(((多余的胳膊和腿))英文为:NSFw,(worst quality:2),(low quality:2),(normal quality:2),lowres,normal quality,((monochrome)),((grayscale)),skin spots,acnes,skin blemishes,age spot,(ugly:1.331),(duplicate:1.331),(morbid:1.21),(mutilated:1.21),(tranny:1.331),mutated hands,(poorly drawn hands:1.5),blurry,(bad anatomy:1.21),(badproportions:1.331),extra limbs,(disfigured:1.331),(missingarms:1.331),(extra legs:1.331),(fused fingers:1.61051),(toomany fingers:1.61051),(unclear eyes:1.331),lowers,bad hands,missing fingers,extra digit,bad hands,missing fingers,(((extraarms and legs)))这些正反向的提示词,我们可以通过点击这个按钮,取一个名字保存为模板。

【SD】真人转二次元?图生图如此强大

相比于文生图,图生图功能除了文本提词框以外还多了一个图片框的输入口,因此,我们还可以通过图片来给与AI创作的灵感。我们随便照一张照片,直接拖入进来。然后可以看到,在文本输入框的旁边有两个反推提示词的按钮:CLIP是可以通过图片反推出完整含义的句子;DeepBooru是可以反推出关键词组。上面的那一张图,我们通过两种反推方式得到的提示词分别为:CLIP——a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art。(一个小男孩坐在长凳上,旁边的地板上放着一辆玩具火车和一辆乐高火车,亚当·雷克斯,详细的产品照片,一张库存照片,莱科艺术,)DeepBooru——shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers。(鞋子,独奏,帽子,橙色背景,黄色背景,微笑,袜子,黑发,坐着,运动鞋)可以看到两种方式生成的提示词都有些瑕疵,比如第一组里面没有描述小孩的穿着,第二组里面没有描述小孩的性别和周围的物品,所以我们需要手动来补充提示词的信息。写好提示词之后,我们再调整一下宽度和高度,让这个红框刚好匹配我们的图片即可。

Others are asking
如何复刻我的声音
以下是复刻声音的相关步骤和信息: 1. 前置数据获取处理 选择音频,开启切割。 有噪音时,进行降噪处理。 降噪处理完成,开启离线 ASR。 2. GPTSowitsTTS 训练集格式化:开启一键三连,耐心等待即可。 微调训练:开启 SoVITS 训练和 GPT 训练。 推理:开始推理 刷新模型 选择微调后的模型 yoyo。 3. 声音复刻 开启声音复刻之旅。 实现跨多语种语言的声音。 实践的样本:AIyoyo 普通话 满江红 GPTSoVITS 的特点: 1. 零样本 TTS:输入 5 秒的声音样本即可体验即时的文本到语音转换。 2. 少量样本训练:只需 1 分钟的训练数据即可微调模型,提高声音相似度和真实感。模仿出来的声音会更加接近原声,听起来更自然。 3. 跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。 4. 易于使用的界面:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具,帮助初学者更容易地创建训练数据集和 GPT/SoVITS 模型。 5. 适用于不同操作系统:项目可以在不同的操作系统上安装和运行,包括 Windows。 6. 预训练模型:项目提供了一些已经训练好的模型,你可以直接下载使用。 GitHub: 视频教程: 使用技巧: 1. 更换音色:一开始会感觉很简单,就只是字生成语音,能选的也就是不同的音色。音色因为基于网络红人训练,因此生成的语音音色会和对应的网络红人非常相像。只要选择和自己需要非常接近的音色即可。如果没有接近的音色,也可以自己训练一个,参考 WaytoAGI 的知识库:
2025-02-08
现在AI领域做语音模型比较好的有哪几家?音色复刻做的比较好的有哪些
在 AI 领域,做语音模型较好的有阿里,其 CosyVoice 语音合成模型有以下特点: 精细控制:能生成符合性别、年龄和个性特征的声音。 自然模拟:可模拟笑声、咳嗽和呼吸等人类语音自然特征。 情感和风格:能够为声音添加情感和风格,更具表现力。 GitHub 链接:https://github.com/FunAudioLLM/CosyVoice 相关链接:https://x.com/imxiaohu/status/1818942399705710700 。但关于音色复刻做的比较好的,上述信息中未明确提及。
2025-01-19
声音复刻
声音复刻相关知识如下: GPTSoVITS 实现声音克隆: 只需 1 分钟语音即可训练一个自己的 TTS 模型,是一个声音克隆和文本到语音转换的开源 Python RAG 框架。 5 秒数据就能模仿,1 分钟声音数据可训练出高质量 TTS 模型,完美克隆声音,适配中文,界面易用。 主要特点包括零样本 TTS、少量样本训练、跨语言支持、易用界面、适用于不同操作系统、提供预训练模型。 GitHub 链接: 视频教程: 前置数据获取处理: 选择音频,开启切割。 有噪音时,进行降噪处理。 降噪处理完成,开启离线 ASR。 GPTSowitsTTS: 训练集格式化:开启一键三连,耐心等待。 微调训练:开启 SoVITS 训练和 GPT 训练。 推理:开始推理 刷新模型 选择微调后的模型 yoyo。 成功后出现新的 URL 表明声音微调完毕。 声音复刻之旅:可实现跨多语种语言的声音。 实践样本:AIyoyo 普通话 满江红 TTS 数据整理: 开源 TTS 数据汇总: 大量语音数据的汇总:https://github.com/RevoSpeechTech/speechdatasetscollection WenetSpeech4TTS:12,800 小时的配对音频 文本数据, 米哈游 星穹铁道:包含中文和日语英文韩语,请注意版权问题!https://github.com/AIHobbyist/StarRail_Datasets 米哈游 原神:包含中文和日语英文韩语,请注意版权问题! 赛博朋克 2077:请注意版权问题! baker 标贝女声:12 小时, Aishell3:85 小时多说话人数据, DiDiSpeech:500 人 60 小时,但目前已经 404 无法再获取, OpenSLR:提供各种语言的合成、识别等语料,https://www.openslr.org/resources.php zhvoice:3200 说话人 900 小时,用于声音复刻,合成,识别等, LibriTTS:基于 Librispeech 筛选而来,更适合用于做 TTS,采样率 24k,大约 585 小时 2,456 人,其中的 trainclean100 包含 53.8 小时/247 个发言人, LJ Speech:大约 24 小时,
2025-01-10
声音复刻
声音复刻主要通过 GPTSoVITS 来实现,以下是相关步骤和信息: 1. 前置数据获取处理: 选择音频并进行切割。 若有噪音,进行降噪处理。 降噪处理完成后,开启离线 ASR。 2. GPTSowitsTTS: 训练集格式化:开启一键三连,耐心等待。 微调训练:开启 SoVITS 训练和 GPT 训练。 推理:开始推理,刷新模型,选择微调后的模型(如 yoyo)。 3. 声音复刻:开启声音复刻之旅,可实现跨多语种语言的声音。 4. 实践的样本: AIyoyo 普通话 满江红 AIyoyo 粤语版 满江红 GPTSoVITS 是一个声音克隆和文本到语音转换的开源 Python RAG 框架,具有以下特点: 1. 零样本 TTS:输入 5 秒的声音样本即可体验即时的文本到语音转换。 2. 少量样本训练:只需 1 分钟的训练数据即可微调模型,提高声音相似度和真实感。 3. 跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。 4. 易于使用的界面:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具,帮助初学者更容易地创建训练数据集和 GPT/SoVITS 模型。 5. 适用于不同操作系统:项目可以在不同的操作系统上安装和运行,包括 Windows。 6. 预训练模型:项目提供了一些已经训练好的模型,你可以直接下载使用。 GitHub: 视频教程: 此外,还有以下开源 TTS 数据可供参考: |汇总|大量语音数据的汇总| |||| |TTS|WenetSpeech4TTS|12,800 小时的配对音频 文本数据| |TTS| |TTS| |TTS|赛博朋克 2077|请注意版权问题!| |TTS中文| |TTS中文| |TTS中文| |TTS中文| |TTS中文|zhvoice|3200 说话人 900 小时,用于声音复刻,合成,识别等| |TTS英文|LibriTTS|基于 Librispeech 筛选而来,更适合用于做 TTS,采样率 24k,大约 585 小时 2,456 人,其中的 trainclean100 包含 53.8 小时/247 个发言人| |TTS英文|LJ Speech|大约 24 小时|
2024-12-16
声音复刻
声音复刻相关内容如下: GPTSoVITS 实现 AIyoyo 声音克隆: 前置数据获取处理:选择音频,开启切割;有噪音时,进行降噪处理;降噪处理完成,开启离线 ASR。 GPTSowitsTTS:训练集格式化需开启一键三连,耐心等待;包括微调训练、推理,推理时开始推理刷新模型选择微调后的模型yoyo,成功后会出现新的 URL 表明声音微调完毕。 声音复刻:可以开启声音复刻之旅,能够实现跨多语种语言的声音。 实践的样本:AIyoyo 普通话满江红 。 GPTSoVITS 实现声音克隆: GPTSoVITS 是一个声音克隆和文本到语音转换的开源 Python RAG 框架。只需 1 分钟语音即可训练一个自己的 TTS 模型,5 秒数据就能模仿,1 分钟的声音数据就能训练出高质量的 TTS 模型,完美克隆声音。主要特点包括零样本 TTS、少量样本训练、跨语言支持、易于使用的界面、适用于不同操作系统、提供预训练模型。 GitHub: 。 TTS 数据整理: 开源 TTS 数据汇总: 大量语音数据的汇总: TTS WenetSpeech4TTS:12,800 小时的配对音频 文本数据: TTS 米哈游 星穹铁道:包含中文和日语英文韩语,请注意版权问题! TTS 米哈游 原神:包含中文和日语英文韩语,请注意版权问题! TTS 赛博朋克 2077:请注意版权问题! TTS 中文 baker 标贝女声:12 小时 TTS 中文 Aishell3:85 小时多说话人数据 TTS 中文 DiDiSpeech:500 人 60 小时,但目前已经 404 无法再获取 TTS 中文 OpenSLR:提供各种语言的合成、识别等语料 TTS 中文 zhvoice:3200 说话人 900 小时,用于声音复刻,合成,识别等 TTS 英文 LibriTTS:基于 Librispeech 筛选而来,更适合用于做 TTS,采样率 24k,大约 585 小时 2,456 人,其中的 trainclean100 包含 53.8 小时/247 个发言人 TTS 英文 LJ Speech:大约 24 小时
2024-12-16
AI复刻怎么做
AI 复刻,以吴恩达开源的 AI 翻译项目 Coze 为例,主要步骤如下: 1. 初步的翻译大模型节点:选择一个大模型对源语言文本进行初始翻译,如选择 MiniMax 大模型,提示词可参考吴恩达教授的相关内容。 2. 选择器节点:判断用户填写的要求中是否有特殊的语言翻译特色或口音。 3. 反思优化的大模型节点:配置反思优化的提示词,告诉模型如何思考和优化翻译结果。提示词的设计至关重要,可参考项目给出的示例提示词,也可根据自身经验和需求改进。 4. 结合反思优化建议再翻译的大模型节点:结合反思优化的建议和初始翻译结果再次进行翻译,以获得更好的翻译结果。 此外,该项目还具有以下特点: 1. 反思优化:通过对自身的反思和优化来提升翻译质量。 2. 使用工具:借助外部工具和资源。 3. 计划:预先制定好 Agent 的实现计划。 4. 多 Agent 合作:通过多个 Agent 之间的合作实现目标。 同时,项目还引入了一些创新点,如分块处理(将长文本拆分成若干小块分别进行翻译和优化,提高处理效率和局部优化效果)和语言习惯指定。 首先,在 Coze 上新建一个工作流,逐步导入核心流程。工作流分为若干节点,每个节点完成特定任务,组合形成完整翻译流程。运行测试时可看到每个节点的执行过程和结果。开始节点需选择翻译的源语言和目标语言,还可设置其他参数,如翻译的语言特色等,建议根据实际情况调整。
2024-09-23
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19