Navigate to WaytoAGI Wiki →
Home/All Questions
有哪些生成精美图片的ai工具
以下是一些生成精美图片的 AI 工具: 1. 文生图工具: DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。 StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 MidJourney:因高质量图像生成效果和友好界面在创意设计人群中流行。 在 WaytoAGI 网站(https://www.waytoagi.com/category/104 ),可以查看更多文生图工具。 2. 图生图工具: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感。 Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 Barbie Selfie Generator:将上传照片转换为芭比风格,效果好。 此外,GPT4o 画图直接输入关键词即可生成精美图片,不需额外软件;带中文的图豆包生成图片效果也不错。但这些工具仍存在一些局限,如偶尔性能不稳定、生成内容不当等。
2025-04-09
AI写作
以下是关于 AI 写作的相关内容: 一、陈财猫的观点 作者陈财猫从自身经历出发,分享了以下关于用 AI 写出比人更好的文字的思考和实践: 1. AI+内容创作是现阶段最好的赛道:基于对大模型发展现状的观察和对“开车”“写作”两类任务的对比,认为该赛道有完美的产品模型匹配和产品市场匹配,且天花板高。 2. AI 写作的实践成果:业务包含营销和小说、短剧创作,开发了智能营销矩阵平台,参与喜马拉雅短故事和短剧写作课程,捣鼓出小财鼠程序版 agent。 3. 定义好文字:好文字能引起人的生理共鸣与情绪,AI 因预训练数据量大能学会引发共鸣,从而写出好文字。 4. 用 AI 写出好文字的方法: 选好模型,评估模型的文风和语言能力、是否有过度道德说教与正面描述趋势、in context learning 能力和遵循复杂指令的能力。 克服平庸,平衡“控制”与“松绑”。 显式归纳想要的文本特征,通过 prompt 中的描述与词语映射到预训练数据中的特定类型文本,往 prompt 里塞例子。 5. 对 AI 创作的看法:AI 创作的内容有灵魂,只要读者有灵魂,文本就有灵魂;有人讨厌 AI 是因其未改变多数人生活,或自身是受害者。作者期望 AI 能力进一步提升,改变每个人的生活。 二、3 月 10 日 AI 资讯中的相关内容 1. 【AI 写作】 Muse:专门为小说创作训练的 AI 模型工具,可实现在线的小说续写修改,创意头脑风暴以及同时基于画布形式的故事创作。可免费试用。 三、AI 写作变现指南 1. 项目启动: 确定目标客户群体,如大学生、职场人士、自媒体从业者等。 选择合适的 AI 写作工具,以满足不同客户的需求。 2. 准备阶段: 学习并实践 AI 写作技术,通过书籍、在线课程等资源提升写作技能。 构建团队,培养和扩充团队成员,以提高运营效率。 3. 商业模式构建: 确定服务内容,如提供论文、报告、文案等直接写作服务。 制定质量控制标准,确保写作内容满足客户要求。 4. 运营与推广: 在淘宝等电商平台上开设店铺,展示并销售写作服务。 建立写作培训社群,分享写作技巧和 AI 应用经验,提升品牌影响力。 通过社交媒体和线下活动进行品牌和社群建设。 与绘画团队、其他写作工作室等合作,共同开发新项目。 5. 项目优化与发展: 持续关注 AI 技术进展,提升服务质量和效率。 根据市场需求,拓展新的服务和产品。 收集客户反馈,不断优化和改进服务。 这份指导强调了 AI 技术在写作服务中的应用,以及如何通过团队建设、质量控制、客户反馈和市场拓展来提升整个业务的竞争力和盈利能力。同时,也提出了与艺术、自媒体等其他领域的合作可能性,以开发衍生项目,进一步扩大业务范围和市场份额。
2025-04-09
单独调用知识库
以下是关于知识库的相关内容: 创建并使用知识库: 在 Bot 内使用知识库: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,包括最大召回数量(Bot 在调用知识库匹配用户输入内容时,返回的数据片段数量,数值越大返回的内容越多)、最小匹配度(Bot 在调用知识库匹配用户输入内容时,会将达到匹配度要求的数据片段进行召回。如果数据片段未达到最小匹配度,则不会被召回)、调用方式(自动调用:每轮对话将自动从所有关联的知识库中匹配数据并召回;按需调用:需要在人设与回复逻辑中提示 Bot 调用 RecallKnowledge 方法,以约束 Bot 在指定时机从知识库内匹配数据)。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用 Knowledge 节点: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 Coze 打造 AI 私人提效助理实战知识库: 在上述步骤中创建好知识库后,就可以在智能体中配置知识库了。在 coze 主页,个人空间 > 项目开发中,打开一个需要添加知识库的智能体,可以选择配置“文本”、“表格”、“照片”三种知识库。下面以配置文本知识库作为例子。点击加号,选择在 1.3 中已经提前创建好的知识库,点击添加。下一步就是配置提示词,让智能体自动使用知识库回答问题。在进行大概地描述以后,点击右上角“优化”,可以自动优化提示词,获得更好的结果。最后,在网页最右方的“预览与调试”中,测试智能体是否正常调用知识库。 集合 Deepseek 提示词方法论: DeepSeek R1 提示词系统完全指南: 三、进阶控制技巧: 1. 思维链引导:分步标记法(请逐步思考:1. 问题分析→2. 方案设计→3. 风险评估)、苏格拉底式追问(在得出最终结论前,请先列举三个可能存在的认知偏差)。 2. 知识库调用:领域限定指令(基于 2023 版中国药典,说明头孢类药物的配伍禁忌)、文献引用模式(以 Nature 2022 年发表的论文为参考,解释 CRISPR Cas9 最新突破)。 3. 多模态输出。 四、高级调试策略: 1. 模糊指令优化: 问题类型:宽泛需求,修正方案:添加维度约束,示例对比:原句:"写小说"→修正:"创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构"。 问题类型:主观表述,修正方案:量化标准,示例对比:原句:"写得专业些"→修正:"符合 IEEE 论文格式,包含 5 项以上行业数据引用"。 2. 迭代优化法: 1. 首轮生成:获取基础内容。 2. 特征强化:请加强第三段的技术细节描述。 3. 风格调整:改用学术会议报告语气,添加结论部分。 4. 最终校验:检查时间逻辑一致性,列出可能的事实性错误。
2025-04-09
知识库的批量创建和调用
以下是关于知识库的批量创建和调用的详细信息: 使用知识库: 在 Bot 内使用: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,包括最大召回数量、最小匹配度和调用方式(自动调用或按需调用)。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 创建知识库并上传表格数据: API 方式: 1. 在表格格式页签下,选择 API,然后单击下一步。 2. 单击新增 API。 3. 输入网址 URL 并选择数据的更新频率,然后单击下一步。 4. 输入单元名称或使用自动添加的名称,然后单击下一步。 5. 配置数据表信息后,单击下一步。 5.1 确认表结构:系统已默认获取了表头的列名,您可以自定义修改列名,或删除某一列名。 5.2 指定语义匹配字段:选择哪个字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。 6. 查看表结构和数据,确认无误后单击下一步。 7. 完成上传后,单击确定。 自定义方式: 1. 在表格格式页面下,选择自定义,然后单击下一步。 2. 输入单元名称。 3. 在表结构区域添加字段,单击增加字段添加多个字段。 4. 设置列名,并选择指定列字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。 5. 单击确定。 6. 单击创建分段,然后在弹出的页面输入字段值,然后单击保存。 创建文本型知识库: 目前支持 5 种导入类型:本地文档、在线数据、notion、飞书、自定义。 在线数据: 自动采集:支持从单个页面或批量从指定网站中导入内容。 添加单个页面的内容: 1. 添加方式:选择添加单个。 2. 更新频率:选择是否自动更新指定页面的内容及自动更新的频率。 3. 网址 URL:输入要采集内容的网址。 批量添加网页内容: 1. 添加方式:选择批量添加。 2. 根地址或网站地图:输入要批量添加的网页内容的根地址或 sitemap 地址,然后单击导入。 3. 导入成功后,单击确认。 手动采集:支持标注要采集的内容,内容上传成功率高。使用手动采集方式,需要先安装浏览器扩展程序。安装步骤,参考。 1. 在新增 URL 页面,选择手动采集。 2. 在弹出的页面输入要采集内容的网址,然后单击确认。 3. 在弹出的页面上,点击页面下方文本标注按钮,开始标注要提取的内容,然后单击文本框上方的文本或链接按钮。 4. 单击查看数据查看已采集的内容,确认无误后再点击完成并采集。
2025-04-09
deep seek辅助写论文
DeepSeek 在辅助写论文方面具有一定的优势和应用场景: 可以快速分析案例,为咨询策划报告提供效率赋能,通过结构化数据提取和逻辑推理,快速定位关键信息,生成具备商业洞察的初步框架。尤其在竞品分析、市场进入策略等场景中可缩短 30%以上的前期研究时间。 但也存在一些不足,例如写长文时可能会太发散、文风用力过猛导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。 在使用 DeepSeek 辅助写论文时,可以参考以下建议: 先与 DeepSeek 讨论思路,获取初步的框架和要点。 对于生成的内容,根据需要进行修改和完善,以符合论文的要求和风格。 用户在使用 DeepSeek 辅助写论文的过程中,还可以尝试让其模仿特定的文风特征,或者通过多轮对话让其增删改查来调整字数。同时,也可以结合其他工具,如 Cloud 3.5 等,以提高论文的质量和效率。
2025-04-09
文生图
以下是关于文生图的详细教程: 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型(麦橘写实、麦橘男团、墨幽人造人等)。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上好看帖子中使用的 lora。 ControlNet:用于控制图片中的特定图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,不用管语法,单词、短语之间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选 DPM++2M Karras 较多,也可参考 checkpoint 详情页中模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一些常见的文生图工具: 腾讯混元、luma、Recraft、文生图大模型 V2.1L(美感版)、美图奇想 5.0、midjourney、快手可图、Flux.1.1、Stable Diffusion 3.5 Large、Imagen 3 网页版
2025-04-09
200万字大模型
以下是关于大模型的相关信息: 4 月 6 日的 XiaoHu.AI 日报中提到:支持文本+图像+视频输入,采用 early fusion 技术整合多模态数据。Scout 支持 1000 万上下文,适合处理超长文本和复杂推理任务;Maverick 有 100 万上下文,长记忆优势适配多场景替代 RAG;Behemoth 是 2 万亿参数级别的大模型在训,已超越 GPT4.5 在 STEM 表现。相关详细介绍及评测的链接为: 。 在质朴发言:大模型未来发展:RAG vs 长文本,谁更胜一筹?|Z 沙龙第 8 期中提到:随着大模型上下文窗口长度不断增加,各个厂商对于文本生成模型呈现出“军备竞赛”的态势。目前,主流的文本生成模型是聊天模型,比如 GPT、Claude 3 等,也有少部分 Base 模型,例如 Yi34 开源模型。两位技术研究人员分享了他们对于大模型的看法:用户使用最多的是 GPT,但对外开放的版本性能较差,用户交互端无法传输大文件,只能通过 API 接口上传。月之暗面的 Kimi 模型大海捞针测试分数很高,但实际使用效果没有达到理想状态。百川 192K 的闭源模型,对于 6 万字的长文本,其表现的推理能力和回答效果很优秀。各种长文本的跑分数据,最高的是 Claude 3 模型。
2025-04-09
长文本模型有哪些
以下是一些常见的长文本模型: 1. 聊天模型:如 GPT、Claude 3 等。 2. Base 模型:例如 Yi34 开源模型。 3. 百川 192K 的闭源模型,对于 6 万字的长文本,其推理能力和回答效果优秀。 4. 通义千问的 Qwen2.51M 大模型,推出 7B、14B 两个尺寸,在处理长文本任务中稳定超越 GPT4omini,且开源推理框架在处理百万级别长文本输入时可实现近 7 倍的提速。 5. 文心一言 4.0、智谱清言、KimiChat 等国产大模型在长文本归纳总结能力方面也有所涉及。
2025-04-09
学术AI工具
以下是一些学术 AI 工具: AI4Science:包括 txyz.ai(https://www.txyz.ai/)、BioGPT(https://github.com/microsoft/BioGPT)、ScienceQA(https://scienceqa.github.io/)、Devin(https://www.cognitionlabs.com/introducingdevin)、Poe(https://poe.com/)、学术 AI(https://chat.uaskgpt.com/)、DeepMath(http://www.deepmath.cn/)、MethGPTPro(https://www.mathgptpro.com/)、RxInfer(https://rxinfer.ml/)、XwinMath(https://github.com/XwinLM/XwinLM/)、LeanDojo(https://leandojo.org/)等。 论文写作方面: 文献管理和搜索:Zotero(结合 AI 技术,可自动提取文献信息)、Semantic Scholar(AI 驱动的学术搜索引擎)。 内容生成和辅助写作:Grammarly(提供文本校对、语法修正和写作风格建议)、Quillbot(基于 AI 的重写和摘要工具)。 研究和数据分析:Google Colab(提供基于云的 Jupyter 笔记本环境)、Knitro(用于数学建模和优化)。 论文结构和格式:LaTeX(结合自动化和模板处理论文格式和数学公式)、Overleaf(在线 LaTeX 编辑器)。 研究伦理和抄袭检测:Turnitin(抄袭检测工具)、Crossref Similarity Check(检测潜在抄袭问题)。 对于医学课题需要修改意见的情况,可以考虑使用 Scite.ai(https://scite.ai/)、Scholarcy(https://www.scholarcy.com/)、ChatGPT(https://chat.openai.com/)。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-09
模型训练的基本名词和方法
以下是关于模型训练的基本名词和方法的介绍: 基本名词: 1. 过拟合&欠拟合:过拟合和欠拟合都是不好的现象,需要加以控制以让模型达到理想效果。解决方法包括调整训练集、正则化和训练参数等,过拟合可减少训练集素材量,欠拟合则增加训练集素材量。 2. 泛化性:泛化性不好的模型难以适应其他风格和多样的创作。可通过跑 lora 模型生图测试判断泛化性,解决办法与过拟合和欠拟合类似,从训练集、正则化、训练参数等方面调整。 3. 正则化:是解决过拟合和欠拟合情况、提高泛化性的手段,给模型加规则和约束,限制优化参数,有效防止过拟合,提高模型适应不同情况的表现和泛化性。 方法: 1. 全面充分采集训练素材:例如在角色训练素材中,应包含各种角度、表情、光线等情况的素材,确保模型具有较好泛化性。 2. 图像预处理:对训练素材进行分辨率调整、裁切操作,并对训练集进行打标签处理。 3. 参数调优:尽量将训练时长控制在半小时左右,过长易导致过拟合,通过调整参数控制时长。 4. 观察学习曲线:通过观察学习曲线来调整训练素材和参数。 5. 过拟合&欠拟合处理:测试训练好的模型,观察过拟合和欠拟合问题,进一步通过调整训练素材和正则化等手段优化。 此外,在模型训练中还需注意: 1. 数据集获取渠道:可通过网上收集、购买、使用无版权问题的如古画等,原则是根据生成图的需求找对应数据集,要清晰、主体元素干净、风格统一。 2. 数据集处理:包括基础处理如裁剪保证清晰和分辨率,更重要的是写标注。 3. 设置模型触发词:可自定义,完整形式可以是一句话,建议以王 flags 模型为主。 4. 统一标注风格与应用场景:例如未来高科技 3D 天然风格,用于互联网首页图像等,并概括主题内容、描述物体特征等。 5. 利用 GPT 辅助描述并人工审核:让 GPT 按要求描述,人工审核修改。 6. 模型训练的准备与流程:完成数据集描述后进入训练流程,选择模型训练分类和数据集,创建并上传数据集压缩包,注意数据名与图片命名一致。选择训练模式和参数,新手选用普通基础模式,训练集质量重要,训练参数中总步数与训练集图片数量相关,触发词设定要避免概念混乱。
2025-04-09