Chat with Wiki - WayToAGI

Navigate to WaytoAGI Wiki →

Home/All Questions

做AI相关的创业，怎么落地找场景

以下是关于 AI 相关创业落地找场景的一些建议： 1. 在游戏领域，现在就开始探索生成式 AI，将努力集中在尚未探索的区域，如“游戏的 Runway”。 2. 注重场景化，给 AI 装上“手”和“眼睛”，通过实践尝试获得实际的数据增长。例如，Notion 和 Character.AI 在这方面取得了成果。 3. 关注专业化、垂直模型的先行场景，如 DoNotPay 在法律应用方面的尝试，以及医疗领域的应用。 4. 对于非技术从业者，在类似客服的应用场景中，要解决大模型存在的幻觉问题，以满足严肃商用场景的要求。总之，AI 创业不仅要能用好市面上的 AI 工具，更要从 AI 效率、变革的角度组织公司架构。同时，把握好融资节奏，在 ToC 产品中注重数据飞轮带来的正反馈效应。

提示语工程

提示工程是一门经验科学，涉及迭代和测试提示以优化性能。在提示工程周期中，大部分精力并非用于编写提示，而是花在开发强大的评估上，然后针对这些评估进行测试和迭代。 Claude 在开箱即用时提供了高水平的基线性能，但提示工程能帮助进一步提升其性能，并对其响应进行微调以适应特定用例。这些技术对实现 Claude 的良好结果不是必要的，但可能对提升输入和输出有用。若要快速开始使用提示或了解提示概念，可参阅提示入门。从提示示例可看出，语言模型能基于给出的上下文内容如“ The sky is ”完成续写，输出结果可能出人意料或高于任务要求，可通过改进提示词获得更好结果。例如，告知模型完善句子，输出结果会更符合最初输入。提示工程就是探讨如何设计出最佳提示词，指导语言模型高效完成任务。以上示例基本说明了现阶段大语言模型能发挥的功能作用，可用于执行文本概括、数学推理、代码生成等各种高级任务。

如何用AI做一篇图文并茂的文章

要使用 AI 做一篇图文并茂的文章，可以参考以下步骤： 1. 明确文章主题：例如通过 Perplexity.AI 的 Discover 功能挖掘热点资讯，选定具有较高关注度的主题。 2. 收集相关资料：借助 AI 高效完成资料收集。 3. 文章内容完善：对文章进行细致的校对和优化，确保内容高质量。 4. 配图选择：认识到配图的重要性，它能打断长段文字、直观展示概念、增加趣味性，但注意不能过多且要相关。选图方法包括截图、使用表情包（注意版权）、从图片网站（如 Unsplash、Pexels）获取。利用 Perplexity.AI 的 Search Images 功能寻找合适素材，注意避免使用带水印、画质不清晰或分辨率低的图片。总之，要打造一篇图文并茂的文章，需要在主题、内容和配图等方面精心策划和选择。

我需要将一个人物照片转换成提示词，可以作为即梦AI创作的提示词用，要求创作出来的人物高度相似，我提供照片

以下是将人物照片转换为即梦 AI 创作提示词的相关知识和步骤： 1. 一般的提示词格式：,。注意两张图片的背景颜色保持一致，有助于融合时的协调。 2. 在 Tusiart 中文生图的操作流程中：定主题：明确生成图片的主题、风格和要表达的信息。选择基础模型 Checkpoint：根据主题选择贴近的模型，如麦橘、墨幽的系列模型。选择 lora：寻找内容重叠的 lora 来控制图片效果和质量。 ControlNet：可控制人物姿态等特定图像，属于高阶技能。局部重绘：后续再学。设置 VAE：选择 840000 即可。 Prompt 提示词：用英文写需求，使用单词和短语组合，不用管语法和长句，单词、短语之间用英文半角逗号隔开。 3. 在【SD】真人转二次元的图生图功能中，除了文本提词框还有图片框输入口。可通过图片反推提示词，如 CLIP 能反推出完整含义的句子，DeepBooru 能反推出关键词组。但反推的提示词可能有瑕疵，需要手动补充信息，调整宽度和高度使红框匹配图片。

如何使用360AI浏览器翻译PDF文本。

360AI 浏览器具有强大的 PDF 文本翻译功能。它不仅内嵌了强大的 PDF 编辑工具和 ChatPDF 的 AI 助手，文章可以一键翻译，支持快速定位原文，降低阅读门槛。遇到不会的概念，可直接询问 AI 并获得回答及索引来源，方便跳转阅读。同时，具有搜索增强能力，能根据文档本身提供细节问题的答案及延展问答。 360AI 浏览器的翻译效果好，基本实现对原有 PDF（PPT）的内容翻译替换，尽量维持原有的阅读体验，可免费使用高质量的沉浸式翻译。此外，360AI 浏览器对于英文 PDF 的阅读与整理能力较强，能正确获取和理解 PDF 的内容。它还有自动生成思维导图等功能，在阅读长文需要总结概括或文档解释时，网页右侧就有 AI 贴心助手，提供文章简介、重点和问答。并且还有许多小细节处理得很好，如文章朗读、全屏沉浸式阅读、直接保存为图片或 PDF、修改字体字号等。

多智能体适合在什么场景下应用

多智能体适合应用的场景较为广泛，常见的有以下几种： 1. 集中式调度：适用于需要全局协调的场景，如机器人协作、交通管制等。在这种模式下，有一个中央控制器负责收集所有智能体的信息，并做出整体最优的决策和资源分配。 2. 分布式调度：常用于大规模、动态、开放的系统，如传感器网络、P2P 网络等。每个智能体根据本地信息和与其他智能体的交互来做出决策，无需中央控制器。 3. 市场驱动调度：适用于电力负载调度、计算资源分配等领域。智能体通过竞价机制获取资源和任务分配，类似于现实市场的供需规律。 4. 约束优化调度：适用于任务分配、资源规划等约束严格的场景。将多智能体协作问题建模为分布式约束优化问题，通过启发式或完全算法求解近似最优解。 5. 组织结构调度：常见于多机器人协作、组织自动化系统中。根据特定的组织拓扑结构（层级、同辈、联盟等）对智能体角色和协作模式进行规范，实现有序调度。 6. 基于规范协议的调度：此外，以旅游场景为例，在设计需要多轮协作的智能体时，比如设计分别负责景点推荐、路线规划和食宿安排的三个智能体，应在多智能体编排页面中设计为一个闭环结构，确保用户在整个对话过程中能够自由地在不同智能体之间切换。同时，要注意跳转设置问题，扣子在节点切换提供了独立和非独立两种识别模式。

哪个AI工具能够较好翻译pdf大文本。

以下是一些能够较好翻译 PDF 大文本的 AI 工具： 1. DeepL（网站）：，点击页面「翻译文件」按钮，上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译（浏览器插件）：，安装插件后，点击插件底部「更多」按钮，选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. Calibre（电子书管理应用）：，下载并安装 calibre，并安装翻译插件「Ebook Translator」。 4. 谷歌翻译（网页）：，使用工具把 PDF 转成 Word，再点击谷歌翻译「Document」按钮，上传 Word 文档。 5. 百度翻译（网页）：，点击导航栏「文件翻译」，上传 PDF、Word、Excel、PPT、TXT 等格式的文件，支持选择领域和导出格式（不过进阶功能基本都需要付费了）。 6. 彩云小译（App）：下载后点击「文档翻译」，可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译（不过有免费次数限制且进阶功能需要付费）。 7. 微信读书（App）：下载 App 后将 PDF 文档添加到书架，打开并点击页面上方「切换成电子书」，轻触屏幕唤出翻译按钮。此外，360AI 浏览器不仅内嵌了强大的 PDF 编辑工具，还内嵌了 ChatPDF 的强大 AI 助手，文章可以一键翻译，且支持快速定位原文，大幅降低阅读门槛。遇到不会的概念，可以直接询问 AI，AI 会快速给你回答，且定位其索引来源，方便跳转阅读。并且具有搜索增强能力，除了可以根据文档本身针对细节问题提供答案，同时也可以给予一些延展问答。360AI 浏览器已向用户免费开放 100 万字长文本阅读功能，正在内测 500 万字长文本处理功能。当打开视频网站时，还可以选择唤起 AI 助理，辅助快速了解文章主体内容。请注意，内容由 AI 大模型生成，请仔细甄别。

sd和mj各自的优缺点在哪？分别更适合什么样的工作内容

Midjourney（MJ）的优点： 1. 角色一致性精度较高，对于 70 80%的工作能大幅提升效率。 2. 高可用性、极佳的用户体验、不错的效果。 3. 不需要像 Stable Diffusion（SD）一样高门槛、高成本地训练自己的 LoRA，只需要一张图。 4. 能生成更多样、更具设计感的角色设计，不受制于特定的模型风格。 5. 有更加可控的设计内容和更多的细节调整空间，比如使用 Midjourney + Stable Diffusion 混合模式进行原画设计，有两到三次的 Prompt 调整空间，并且能够运用 SD Controlnet 的各种功能对设计细节进行更多更细致的调节。 6. 可以产出比单纯使用一种 AI 进行设计更加合理的结构和更丰富的细节。 7. 效率极高，在使用合适的 Prompt 情况下，使用较好的硬件，一个完整的方案产出示例不会超过十五分钟。 8. 能极大地避免可能造成的版权争议和信息泄露风险。 Midjourney（MJ）的缺点：可能还达不到绝对一致性的标准。 Midjourney（MJ）更适合的工作内容：首当其冲的是所有非真人领域，比如游戏、漫画、动漫、绘本等，在商业领域和专业工作流中也有一席之地。 Stable Diffusion（SD）的优点： 1. 提示词占比相对较低，模型和参数及插件占比较高，分别为 30%和 40%，有更多可调节的空间。 Stable Diffusion（SD）的缺点：提示词的重要性相对较低，需要高门槛、高成本地训练自己的 LoRA。 Stable Diffusion（SD）更适合的工作内容：暂无明确提及。

找一些实时翻译网页的插件

以下是为您推荐的一些实时翻译网页的插件和工具： 1. DeepL（网站）：，点击页面「翻译文件」按钮，上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译（浏览器插件）：，安装插件后，点击插件底部「更多」按钮，选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. calibre（电子书管理应用）：，下载并安装 calibre，并安装翻译插件「Ebook Translator」。 4. 谷歌翻译（网页）：，使用工具把 PDF 转成 Word，再点击谷歌翻译「Document」按钮，上传 Word 文档。 5. 百度翻译（网页）：，点击导航栏「文件翻译」，上传 PDF、Word、Excel、PPT、TXT 等格式的文件，支持选择领域和导出格式（不过进阶功能基本都需要付费了）。 6. 彩云小译（App），下载后点击「文档翻译」，可以直接导入 PDF、PDF、Word、Excel、PPT、TXT、epub、srt 等格式的文档并开始翻译（不过有免费次数限制且进阶功能需要付费）。 7. 微信读书（App），下载 App 后将 PDF 文档添加到书架，打开并点击页面上方「切换成电子书」，轻触屏幕唤出翻译按钮。 8. 浏览器自带的翻译功能，如果一些 PDF 太大，翻译工具不支持，除了将 PDF 压缩或者切分外，还可以转成 HTML 格式，然后使用浏览器自带的网页翻译功能。此外，还有 RTranslator 这款开源、免费离线的实时翻译应用，可实现多人、多语言的实时对话翻译，对话模式通过对方的手机或蓝牙耳机播放，包括对话模式、对讲机模式和文本翻译三种模式，链接：。

学习AI3D建模，那些平台更实用

目前在学习 AI 3D 建模方面，以下几个平台较为实用： 1. Blender：功能强大且开源免费，拥有丰富的插件和教程资源。 2. Maya：广泛应用于影视、游戏等领域，提供了全面的建模工具和强大的渲染功能。 3. 3ds Max：在建筑可视化、游戏开发等方面表现出色，具有易于上手的操作界面。 4. ZBrush：专注于数字雕刻，适合创建高精度的模型细节。您可以根据自己的需求和学习偏好选择适合您的平台。