Navigate to WaytoAGI Wiki →
Home/All Questions
文生图片哪个好
以下是对一些文生图模型的介绍及相关提示词和操作的说明: 文生图模型排序(从高到低): 1. Imagen 3:真实感满分,指令遵从强。 2. Recraft:真实感强,风格泛化很好,指令遵从较好(会受风格影响)。 3. Midjourney:风格化强,艺术感在线,但会失真,指令遵从较差。 4. 快手可图:影视场景能用,风格化较差。 5. Flux.1.1:真实感强,需要搭配 Lora 使用。 6. 文生图大模型 V2.1L(美感版):影视感强,但会有点油腻,细节不够,容易糊脸。 7. Luma:影视感强,但风格单一,糊。 8. 美图奇想 5.0:AI 油腻感重。 9. 腾讯混元:AI 油腻感重,影视感弱,空间结构不准。 10. SD 3.5 Large:崩。 【SD】文生图提示词: 英文为:, (toomany finger。 Tusiart 简易上手教程: 提示词相关性:指图像与用户输入 prompt 的匹配程度。数字越大,图像就越接近你的提示。但数字过高会让图像质量下降。在 5 15 之间为好,一般用 7、9、12。 随机种子:生成的每张图都有随机种子,在固定好种子以后,可以对图片进行“控制变量”效果的操作,比如说修改提示词、修改 clip 跳过层等等。 ADetailer:面部修复插件,预防或解决脸部崩坏的超强小工具,高阶操作后面再学,没事勾上也 OK。 CLIP skip:设成 2 就行。
2025-03-28
飞书多维表格如何接入gemini?
要将飞书多维表格接入 Gemini,以下是一些相关的操作步骤和说明: 首先,请注意部分操作需要搭配 Google 云服务或自备 API 才可以正常练习,具体内容)。友情提示,从这一部分及以后内容,多数都会是配合代码完成的,如果您是 0 代码学习者,尝试看懂提示词,并在一些 AI 产品上尝试使用。 接下来,课程将深入探讨代码部分。为了运行这个笔记本,需要执行一些设置代码。首先,需要导入 utils 并进行身份验证,这意味着需要设置一些凭证和项目 ID,以便能够从笔记本环境调用云端的 Gemini API。项目包含在云中使用的资源和 Gemini API。这个设置过程确保了笔记本能够正确连接和使用 Gemini 模型。 对于本课程,还需要指定一个区域,即代码将在哪里执行。在这种情况下,使用的是 uscentral1。 接下来,课程将导入 Vertex AI SDK。Vertex AI SDK 可以看作是一个 Python 工具包,帮助用户与 Gemini 交互。通过这个 SDK,可以使用 Python 调用 Gemini API 并获得响应。 在笔记本中,需要初始化 Vertex SDK。这意味着需要告诉 SDK 以下信息: 1. 使用的项目 2. 想要使用 Gemini 模型的区域 3. 用户凭证 通过提供这些信息,Gemini API 就能识别用户身份,并确认用户有权使用 API。 为了使用 Gemini API,需要从 SDK 中导入 generative_model。设置完成后,需要指定具体的模型。这可以通过设置 model 变量来完成,使用刚刚导入的 generative_model,并选择特定的 Gemini 模型。在这个案例中,课程将使用 Gemini 1.0 Pro 版本。这个选择反映了对于当前任务,Gemini Pro 可能是最合适的平衡点,提供了良好的性能和效率。 此外,Gemini 不仅是单一模型,而是一个模型系列,包含不同大小的模型,每种大小都针对特定的计算限制和应用需求而定制。首先是 Gemini Ultra,这是系列中最大和最强大的模型。Gemini Pro 被设计为多功能的主力模型,平衡了模型性能和速度。还有 Gemini Flash,这是一个专门为高容量任务设计的最快、最具成本效益的模型。最后是 Gemini Nano,它是 Gemini 家族中的轻量级成员,专门设计用于直接在用户设备上运行。
2025-03-28
针对于论文的promt
以下是关于论文的 prompt 相关内容: DALL·E 3 论文公布、上线 ChatGPT:与 Midjourney 相比,DALL·E 3 使用门槛更低。其模型能力提升来自详尽的图像文本描述、训练的图像文本描述模型、使用的 T5 文本编码器、用 GPT4 完善用户提示、训练的 Unet 解码器等。但文本渲染仍不可靠。此外,DALL·E 3 已正式上线 ChatGPT,Plus 用户和 Enterprise 用户可用。 学术场景数据处理:大模型结合有效的提示词可迅速总结概括论文,如 GLM4Plus 能帮助学生快速总结。还能进行论文翻译和内容扩写润色,针对不同需求有相应的提示词和示例。 李继刚等的 prompt 最佳实践:以学术阅读(读论文)为例,对论文进行概括总结,包括提出基于 GPT3 的无代码聊天机器人设计工具 BotDesigner 及创建的两个界面,还有经过验证的结论和关键信息等。
2025-03-28
推荐些AI文章
以下是为您推荐的一些 AI 文章: 1. 《新手如何学习 AI?》 了解 AI 基本概念:建议阅读「」部分,熟悉术语和基础概念,包括主要分支及联系。 浏览入门文章,了解历史、应用和发展趋势。 开始 AI 学习之旅:在「」中有为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台按自己节奏学习。 选择感兴趣的模块深入学习,比如图像、音乐、视频等,掌握提示词技巧。 实践和尝试:理论学习后通过实践巩固知识,在知识库分享实践成果。 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动。 2. 《01通往 AGI 之路知识库使用指南》 包括关于 AI 知识库使用及 AIPO 活动的介绍,AIPO 线下活动及 AI 相关探讨,way to AGI 社区活动与知识库介绍,关于 AI 知识库及学习路径的介绍,时代杂志评选的领军人物,AI 相关名词解释,知识库的信息来源,社区共创项目,学习路径,经典必读文章,初学者入门推荐,历史脉络类资料等内容。 3. 《【AI 学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)》 上篇文章解决了 Why 的问题,此次解决 What 和 How 的问题。 推荐两个视频: 【包教包会】一条视频速通 AI 大模型原理_哔哩哔哩_bilibili](女神)主讲,和某知识 up 主 Genji 一起制作的免费公益课,50 分钟速通 AI 大模型原理。 ,某知识 up 主老石谈芯专访安克创新 CEO 阳萌的视频,一共两期,内容值得观看。
2025-03-28
推荐些AI文章
以下是为您推荐的一些 AI 文章: 1. 《新手如何学习 AI?》 了解 AI 基本概念:建议阅读「」部分,熟悉术语和基础概念,包括主要分支及联系。 浏览入门文章,了解历史、应用和发展趋势。 开始 AI 学习之旅:在「」中有为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台按自己节奏学习。 选择感兴趣的模块深入学习,比如图像、音乐、视频等。掌握提示词技巧。 实践和尝试:理论学习后通过实践巩固知识,在知识库分享实践成果。 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等互动,了解工作原理和交互方式。 2. 《01通往 AGI 之路知识库使用指南》 包括关于 AI 知识库使用及 AIPO 活动的介绍,AIPO 线下活动及 AI 相关探讨,way to AGI 社区活动与知识库介绍,关于 AI 知识库及学习路径的介绍,时代杂志评选的领军人物,AI 相关名词解释,知识库的信息来源,社区共创项目,学习路径,经典必读文章,初学者入门推荐,历史脉络类资料等内容。 3. 《【AI 学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)》 由 Allen 撰写,旨在帮助入门同学建立框架。推荐了两个视频: 【包教包会】一条视频速通 AI 大模型原理_哔哩哔哩_bilibili](女神)主讲,和某知识 up 主 Genji 一起制作的免费公益课。 ,某知识 up 主老石谈芯专访安克创新 CEO 阳萌的视频。
2025-03-28
dify学习
Dify 是一个开源的大模型应用开发平台: 理念:结合后端即服务和 LLMOps 的理念。 特点:提供直观界面,能快速构建和部署生产级别的生成式 AI 应用。具有强大的工作流构建工具,支持广泛的模型集成,有功能丰富的提示词 IDE 和全面的 RAG Pipeline 用于文档处理和检索。允许用户定义 Agent 智能体,通过 LLMOps 功能对应用程序性能持续监控和优化。 部署选项:提供云服务和本地部署,满足不同用户需求。 开源特性:确保对数据的完全控制和快速产品迭代。 设计理念:注重简单性、克制和快速迭代,旨在帮助用户将 AI 应用的创意快速转化为现实。 推荐使用方式:个人研究推荐单独使用,企业级落地项目推荐多种框架结合。 Dify 官方手册:https://docs.dify.ai/v/zhhans
2025-03-28
prompt提示词教学文档
以下是为您提供的 prompt 提示词教学文档: 一、Prompt 的专场教程 基础篇 1. 解释了什么是 prompt(提示词)以及为何其被称为咒语,使用 AI 的人被称为魔法师。 2. 阅读完本教程可迅速入门 prompt 的使用,达到一般公司设计岗所需的 AI 绘图水准。 3. 阅读时长约 30 分钟,建议打开任意一款 SD 产品分屏对照使用。若有不清晰之处,可在评论区发言或添加微信 designurlife1st 沟通(备注来意:ai 绘图交流)。 二、集合 Deepseek 提示词方法论 1. 核心原理认知 AI 特性定位:支持多模态理解,包括文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 8K tokens 上下文窗口,约 4000 汉字)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重(开头/结尾)、符号强调敏感。 2. 基础指令框架 可套用框架指令,包括四要素模板。 格式控制语法:强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号>表示关键要求,!表示禁止项。 三、小七姐:Prompt 喂饭级系列教程小白学习指南(一) 1. 认为对于 prompt 新手教程的帖子比较零散,不成体系,进行了统一收集和整理。 2. 学习 prompt 的第一步要有一个大模型帐号,并熟悉与之对话的方式,推荐 ChatGPT4 及国产平替:。 3. 第二步要看 OpenAI 的官方文档,包括。
2025-03-28
短视频文案创作哪个AI能力最强
在短视频文案创作方面,以下几种 AI 能力表现较为突出: Kimi:作为国产大模型,在对中文的理解和写作能力上有一定优势。例如在修改文案使其更押韵方面能有不错的表现。 ChatGPT:能根据具体需求进行写作,作品有其特点。 美趣 AI:具有图片生成和写作生成的功能。 说得相机提词器:是一款写作软件。 AI 智能写作:原生的写作软件。 创客贴 AI:具备平面设计和文案生成的能力。 图趣 AI:原生的图片生成工具。 Molica AI:原生的图片生成工具。 文案宝:原生的个人助理,能进行 AI Bot 智能写作和识图。 此外,在一些挑战赛中,如 Show Me 扣子 AI 挑战赛大消费行业专场中,“营销文案创作专家深度版”能够为企业营销团队等提供从文案框架创作到生成的一站式服务,并进行营销数据分析。
2025-03-28
AI切磋大会
AI 切磋大会是 WaytoAGI 每月举办的 AI 视频、绘画、音乐、agent 等多方面的切磋交流分享会。 第五期于 8 月 31 日举办,主题为“AI 摆摊+项目路演展示”,线下在北上广深杭郑州武汉南京成都重庆长沙厦门西安昆明大理 15 地云聚会,线上同学可加入会议或围观,成果展示,有前四期活动记录,照片收集空文档届时欢迎大家上传,相关链接:。 第四期于 7 月 28 日举办,主题为“AI 技能交换(AI 摆摊赚钱)”,有前三期活动记录,线下在北上广深杭郑州武汉南京成都重庆长沙厦门西安昆明大理 15 地云聚会,活动已结束,可线上参与,成果展示,照片收集空文档届时欢迎大家上传,相关链接:。 第八期于 11 月 30 日举办,主题为“GameJam”,大家一起线下做游戏/应用,线下在北上广深杭郑州武汉南京成都重庆长沙厦门西安昆明大理 15 地云聚会,线上同学可加入游戏设计或围观,有具体的时间安排和相关链接,报名链接:https://waytoagi.feishu.cn/share/base/form/shrcnWZP4esOYmh8DTz63l2Nydh ,提醒注意场地位置和报名短信接收。
2025-03-28
tars
Tars 相关信息如下: Tars 是一个 Obsidian 插件,基于标签建议进行文本生成,支持 Claude、OpenAI、Kimi、豆包、阿里千问、智谱、深度求索、百度千帆等。项目地址:https://github.com/TarsLab/obsidiantars 。其安装配置包括启用插件和配置插件。 UITARS 是字节的原生 GUI 智能体模型,模仿人类使用电脑或手机的方式,通过截图识别界面元素并执行操作。集成四大核心能力:感知(界面识别)、行动(操作指令)、推理(多步任务规划)、记忆(操作记录)。实现端到端学习,具备“直觉式”反应(System1)和深度思考能力(System2)。开源项目地址:https://github.com/bytedance/UITARS ,Hugging Face:https://huggingface.co/bytedanceresearch/UITARS7BSFT 。 有开发者使用树莓派创建了一个完全功能的 TARS 复制品,最新版本甚至配备了双机械臂,可以与周围环境互动。Charles Diaz 详细公布了其制作教程、CAD 图纸和零件、代码。
2025-03-28