Navigate to WaytoAGI Wiki →
Home/All Questions
AI生图
以下是关于 AI 生图的详细教程: 一、Liblibai 简易上手教程 1. 定主题:明确您想要生成的图片的主题、风格和表达的信息。 2. 选择 Checkpoint:根据主题选择贴近内容的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需管语法和长句。 7. 负向提示词 Negative Prompt:同样用英文单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:使用 DPM++2M Karras 时,在 30 40 之间选择,过多意义不大且慢,过少出图效果差。 10. 尺寸:根据个人喜好和需求选择。 11. 生成批次:默认 1 批。 二、AI 线上绘画教程 如果您在工作中需要大量图片,又不想面临版权问题,AI 生图是高效的解决办法。人像、动物、自然风景、人造景观等都可以用 AI 生成。主流工具 midjourney 付费成本高,stable diffusion 硬件门槛不低,但有像这样的免费在线 SD 工具网站。本教程旨在让入门玩家在半个小时内自由上手创作绘图。 三、Tusiart 简易上手教程 1. 图生图:上传图片后,sd 会根据图片、选择的模型及输入的 prompt 等信息重绘,重绘幅度越大,输出图与输入图差别越大。 2. 尺寸:太小生成不了内容,太大 AI 会放飞自我,如需高清图,可设中等尺寸并用高分辨率修复。 3. 采样算法:即让 AI 用何种算法生图。 4. 采样次数:次数越多调整越精密,理论上出图效果越好,但耗时越长,且并非越多越好。 5. 提示词相关性:数字增大图像更接近提示词,但过高会使图像质量下降。 6. 随机种子 seed:每张图都有随机种子,固定种子后可进行“控制变量”操作,首次生成图时无需动。 7. Clip Skip:一般设为 2,早期无需过多关注。 8. ENSD:eta 噪声种子增量,默认 0 即可。
2025-04-09
人工智能发展历程
人工智能的发展历程如下: 二十世纪中叶,人工智能领域开启,符号推理流行,出现专家系统,但因方法局限性和成本问题,20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源更便宜,数据更多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中,“人工智能”常被视为“神经网络”的同义词。 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为神经网络奠定基础。 1950 年,图灵最早提出图灵测试作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开达特茅斯会议,“人工智能”一词被正式提出,并确立为一门学科。此后近 70 年,AI 发展起起落落。 AI 技术发展历程包括:早期阶段(1950s 1960s)的专家系统、博弈论、机器学习初步理论;知识驱动时期(1970s 1980s)的专家系统、知识表示、自动推理;统计学习时期(1990s 2000s)的机器学习算法(决策树、支持向量机、贝叶斯方法等);深度学习时期(2010s 至今)的深度神经网络、卷积神经网络、循环神经网络等。
2025-04-09
全能写作专家
《执笔者》:基于多 Agent 模式的全能写手 成果展示: 多 agent 协作的《执笔者》搭建用时不到 10 分钟(在之前的 bot 或工作流已调试好的前提下),目前协作了三个 agent,每个 agent 都根据任务分工集成了不同的工作流、图像流等内容,各司其职,互不干扰,整体交互模式保持一致。其主要功能是支持小红书、公众号和头条平台的图文创作,简单使用“主题词+平台类型”即可召唤相关 bot 输出优质内容。《执笔者》的出现极大地提高了工作效率,后续会不断更新迭代(人物专栏、作文、书籍等),成为真正的全能优质写手。感兴趣的朋友欢迎前往试用:https://www.coze.cn/store/bot/7387404430825668643?panel=1&bid=6d1b1va9o1g18 商业模式: 接入微信或者抖音,通过为广大创作者提供服务的方式引流,为品牌商或特殊客户提供批量优质定制文案收费服务,BOTID:7386947021552320564 操作步骤: 1. 多 agent 模式切换:在 bot 编排页面点选多 agent 模式,页面将会自动切换为多 agent 调试状态,相比单 agent,主要是多了中间一块的 agent 连接区。 2. 添加合适节点:节点有两种方式可以选择,用已发布的 bot,或者创建一个新的 agent,按需选取。添加的 agent 直接连接在默认的总管 agent(“执笔者”)后面即可,无结束节点。 3. 添加合适的 prompt:在多 agent 模式下,需要为每个 agent 填写合适的 prompt。外围的人设填写该 bot 的主要功能,内部的 bot 填写各个 bot/agent 的应用场景。 4. 调试与美化:经过以上简单三步,一个多 agent 的 bot 就基本搭建完成,接下来就是漫长的调试过程,如果输出与自己设想有差异,可以不断调整外围和内部 bot 的提示词,提升命中率,优化交互。 创作背景: 在全民自媒体时代,内容创作成为重要的表达方式。coze 平台上的图文创作 bot 虽吸引创作者关注,但现有的图文 bot 主要分为两类,一类专注特定垂直领域,无法满足博主跨平台需求;另一类不够专业优质。对于很多自媒体博主,需要同时入驻多个平台,根据不同平台格式和调性创作,单一或泛泛的文案创作助手不能满足需求。因此,作者萌生打造全且优的文案创作助手的想法,想到用多 agent 模式整合之前开发的小红书和头条文案创作 bot,节省复杂的 prompt 书写和调试工作。具体分 4 步拆解。 原文链接:https://developer.volcengine.com/articles/7387306376004894783 作者:用户 6810070191084、芋头小宝
2025-04-09
genspark怎么样?和cursor、manus等相比如何?
Genspark 是一款功能强大的通用智能体,具有以下特点和优势: 1. 功能集成:集 AI 聊天、图片工作室、视频生成、深度研究等多种功能于一体。 2. 任务处理能力:能够自动完成复杂任务,如自主规划、深入研究、预定外部服务、进行数据搜索和事实核查等。 3. 工具和数据集:世界上首个 MixtureofAgents 系统,利用最佳模型、工具和数据集来执行不同任务。 4. 性能表现:在 GAIA 基准测试的三个级别(Level 1、Level 2、Level 3)中得分均最高,显示出在多轮对话和复杂任务处理上的优势,能更准确地反映用户与 AI 助手互动对话的需求。 5. 速度和可靠性:近乎即时的结果,执行过程中的错误和幻觉显著减少,让用户能够掌控和优化输出。 与 Manus 相比,Genspark 更加快速和可靠,表现更为成熟与稳定。 您可以通过 https://www.genspark.ai/ 直接使用,不过注意第一个问题可以稍微思考下再提问,因为可能提一个问题之后就要收费啦。其两位创始人是明星创业者,联合创始人景鲲之前是小度科技的 CEO,联合创始人兼 CTO 朱凯华则是小度科技的 CTO。相关媒体报道可参考: 1. 特工宇宙:超越 Manus?华人创业产品 Genspark 推出通用 Agent(附实测效果) https://mp.weixin.qq.com/s/S2NCd3ySZyaRtjwC6BSG6Q 2. MAX:用过最新的 Genspark 后,我已经准备去摆摊了。 https://mp.weixin.qq.com/s/mK1Y7kmIqW56FkrJd64Vtw
2025-04-09
ai rules
以下是关于 AI 规则的相关内容: 在 Cursor 中,您可以通过修改 Cursor Settings>General>Rules for AI 部分来添加自定义指令。此自定义说明将包含在 Cursor Chat 和 Ctrl/⌘K 等功能中。对于特定于项目的说明,您可以将其包含在项目根目录的.cursorrules 文件中,与“AI 规则”部分相同,该文件中的说明也将包含在 Cursor Chat 和 Ctrl/⌘K 等功能中。 欧盟《人工智能法案》: 全面禁止人工智能(AI)用于生物识别监控、情绪识别、预测性警务。 生成式人工智能系统如 ChatGPT 必须披露内容是人工智能生成的。 用于在被认为高风险的选举中影响选民的人工智能系统被视为高风险。 规则旨在促进以人为本、值得信赖的人工智能的应用,并保护健康、安全、基本权利和民主免受其有害影响。 欧洲议会以 499 票赞成、28 票反对、93 票弃权的结果通过了人工智能法案的谈判立场,这些规则将确保欧洲开发和使用的人工智能完全符合欧盟的权利和价值观,包括人类监督、安全、隐私、透明度、非歧视以及社会和环境福祉。 欧洲议会和欧盟理事会规定人工智能的统一规则,并修正了一系列相关条例,在风险管理、所使用数据集的质量和相关性、技术文件和记录保存、透明度和向部署者提供信息、人工监督、稳健性、准确性和网络安全方面,应对高风险人工智能系统提出要求。这些要求是有效降低健康、安全和基本权利风险所必需的,而且没有其他贸易限制性较小的措施可以合理利用,从而避免对贸易造成不合理的限制。
2025-04-09
AI编程蓝皮书
以下是关于“AI 编程蓝皮书”的相关内容: 字节发布全新 AI IDE:Trae,免费使用 Claude,发布 3 天阅读量超 3 万。Trae 原生中文支持,无需安装中文插件,语言设置为中文后操作细节清晰明了,还有匠心设计的交互体验,比如直接叫审查,不用琢磨 Diff。 2 月 18 日晚 8:00 有关于 Trae 的直播,飞书会议地址为 https://vc.feishu.cn/j/254331715,邀请了多位重磅嘉宾。 有人受小红书金句格言卡片启发,思考能否通过简单操作实现卡片制作工具。看了黄叔的《AI 编程蓝皮书》和直播课,明白目前编程可用自然语言交互实现,降低了门槛,清晰向 AI 说明需求很重要,以及了解了调用 API 是怎么回事。相关文档:
2025-04-09
deepseek论文指令
以下是关于 Deepseek 提示词方法论的相关内容: 一、进阶控制技巧 1. 思维链引导 分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估 苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差 2. 知识库调用 领域限定指令:基于 2023 版中国药典,说明头孢类药物的配伍禁忌 文献引用模式:以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破 3. 多模态输出 二、高阶能力调用 1. 文风转换矩阵 作家风格移植:“用鲁迅杂文风格写职场 PUA 现象” 文体杂交:“将产品说明书改写成《史记》列传格式” 学术口语化:“把这篇论文摘要翻译成菜市场大妈能听懂的话” 2. 领域穿透技术 行业黑话破解:“解释 Web3 领域的‘胖协议瘦应用’理论” 商业决策支持 三、场景化实战策略 1. 创意内容生成 2. 技术方案论证 四、高级调试策略 1. 模糊指令优化 问题类型:宽泛需求 修正方案:添加维度约束 示例对比:原句:“写小说”→修正:“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构” 问题类型:主观表述 修正方案:量化标准 示例对比:原句:“写得专业些”→修正:“符合 IEEE 论文格式,包含 5 项以上行业数据引用” 2. 迭代优化法 首轮生成:获取基础内容 特征强化:请加强第三段的技术细节描述 风格调整:改用学术会议报告语气,添加结论部分 最终校验:检查时间逻辑一致性,列出可能的事实性错误 五、效能增强技巧 1. 对话记忆管理 上下文锚定:“记住当前讨论的芯片型号是麒麟 9010” 信息回溯:“请复述之前确认的三个设计原则” 焦点重置:“回到最初讨论的供应链问题” 2. 输出质量控制 问题类型:过度抽象 修正指令:“请具体说明第三步操作中的温度控制参数” 问题类型:信息过载 修正指令:“用电梯演讲格式重新组织结论” 问题类型:风格偏移 修正指令:“回归商务报告语气,删除比喻修辞” 六、特殊场景解决方案 1. 长文本创作 分段接力法:“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应” 2. 敏感内容处理 概念脱敏法:“用经济学原理类比说明网络审查机制” 场景移植法:“假设在火星殖民地讨论该议题” 七、性能监测体系 1. 需求理解准确率:复杂需求首轮响应匹配度 2. 知识迁移能力:跨领域案例应用的合理性 3. 思维深度指数:解决方案的因果链条长度 新一代交互范式建议: 1. 采用「人机共谋」模式:先陈述思路梗概,再让 AI 补充完善“我想从这三个方向切入,你觉得哪个最有潜力?为什么?” 2. 启动「思维可视化」指令:kookolp“用思维导图形式展示当前推理过程” 3. 实施「苏格拉底式对话」:“连续追问五个‘为什么’来挖掘根本原因” R1 带来的提示词使用新步骤: 首先明确场景和任务 其次选择模型类型 之后再写提示词
2025-04-09
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,比如覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-04-09
有没有AI客服呢帮我解决天猫店铺的客服问题
天猫店铺有可用的 AI 客服,例如阿里的“小蜜”。在去年双 11 购物节,小蜜累计服务 4.1 亿次咨询,占比 85%,仅复杂纠纷转人工,用户满意度并未因是 AI 而下降,反而因回复快提升。此外,电商领域还有其他类似的 AI 客服应用,如京东推出的智能客服“JIMI”,每天处理数百万咨询,问题解决率超过 90%,使得京东客服团队规模缩小,有效分流了工作量。亚马逊的“智能客服代理”能通过对话 API 访问客户订单等数据,帮助顾客查询物流、办理退货,在上季度独立处理了超过 50%的客户请求。抖音小店客服也引入了 AI 回复,提升了商家客服响应速度。
2025-04-09
AI的基础知识了解
以下是关于 AI 基础知识的介绍: AI 背景知识: 基础理论:明确人工智能、机器学习、深度学习的定义以及它们之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等基本概念。 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:了解其基本概念。 评估和调优: 性能评估:知道如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等基本结构。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 对于新手学习 AI,建议: 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,了解其主要分支及联系,浏览入门文章。 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,通过在线教育平台按自己节奏学习并获取证书。 选择感兴趣的模块深入学习:AI 领域广泛,可根据兴趣选择特定模块,如掌握提示词技巧。 实践和尝试:理论学习后进行实践,尝试使用各种产品并分享作品。 体验 AI 产品:与如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。
2025-04-09