Navigate to WaytoAGI Wiki →
Home/All Questions
做AI相关的创业,怎么落地找场景
以下是关于 AI 相关创业落地找场景的一些建议: 1. 在游戏领域,现在就开始探索生成式 AI,将努力集中在尚未探索的区域,如“游戏的 Runway”。 2. 注重场景化,给 AI 装上“手”和“眼睛”,通过实践尝试获得实际的数据增长。例如,Notion 和 Character.AI 在这方面取得了成果。 3. 关注专业化、垂直模型的先行场景,如 DoNotPay 在法律应用方面的尝试,以及医疗领域的应用。 4. 对于非技术从业者,在类似客服的应用场景中,要解决大模型存在的幻觉问题,以满足严肃商用场景的要求。 总之,AI 创业不仅要能用好市面上的 AI 工具,更要从 AI 效率、变革的角度组织公司架构。同时,把握好融资节奏,在 ToC 产品中注重数据飞轮带来的正反馈效应。
2024-08-13
提示语工程
提示工程是一门经验科学,涉及迭代和测试提示以优化性能。在提示工程周期中,大部分精力并非用于编写提示,而是花在开发强大的评估上,然后针对这些评估进行测试和迭代。 Claude 在开箱即用时提供了高水平的基线性能,但提示工程能帮助进一步提升其性能,并对其响应进行微调以适应特定用例。这些技术对实现 Claude 的良好结果不是必要的,但可能对提升输入和输出有用。若要快速开始使用提示或了解提示概念,可参阅提示入门。 从提示示例可看出,语言模型能基于给出的上下文内容如“ The sky is ”完成续写,输出结果可能出人意料或高于任务要求,可通过改进提示词获得更好结果。例如,告知模型完善句子,输出结果会更符合最初输入。提示工程就是探讨如何设计出最佳提示词,指导语言模型高效完成任务。以上示例基本说明了现阶段大语言模型能发挥的功能作用,可用于执行文本概括、数学推理、代码生成等各种高级任务。
2024-08-13
如何用AI做一篇图文并茂的文章
要使用 AI 做一篇图文并茂的文章,可以参考以下步骤: 1. 明确文章主题:例如通过 Perplexity.AI 的 Discover 功能挖掘热点资讯,选定具有较高关注度的主题。 2. 收集相关资料:借助 AI 高效完成资料收集。 3. 文章内容完善:对文章进行细致的校对和优化,确保内容高质量。 4. 配图选择: 认识到配图的重要性,它能打断长段文字、直观展示概念、增加趣味性,但注意不能过多且要相关。 选图方法包括截图、使用表情包(注意版权)、从图片网站(如 Unsplash、Pexels)获取。 利用 Perplexity.AI 的 Search Images 功能寻找合适素材,注意避免使用带水印、画质不清晰或分辨率低的图片。 总之,要打造一篇图文并茂的文章,需要在主题、内容和配图等方面精心策划和选择。
2024-08-13
我需要将一个人物照片转换成提示词,可以作为即梦AI创作的提示词用,要求创作出来的人物高度相似,我提供照片
以下是将人物照片转换为即梦 AI 创作提示词的相关知识和步骤: 1. 一般的提示词格式:,。注意两张图片的背景颜色保持一致,有助于融合时的协调。 2. 在 Tusiart 中文生图的操作流程中: 定主题:明确生成图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 来控制图片效果和质量。 ControlNet:可控制人物姿态等特定图像,属于高阶技能。 局部重绘:后续再学。 设置 VAE:选择 840000 即可。 Prompt 提示词:用英文写需求,使用单词和短语组合,不用管语法和长句,单词、短语之间用英文半角逗号隔开。 3. 在【SD】真人转二次元的图生图功能中,除了文本提词框还有图片框输入口。可通过图片反推提示词,如 CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组。但反推的提示词可能有瑕疵,需要手动补充信息,调整宽度和高度使红框匹配图片。
2024-08-12
如何使用360AI浏览器翻译PDF文本。
360AI 浏览器具有强大的 PDF 文本翻译功能。它不仅内嵌了强大的 PDF 编辑工具和 ChatPDF 的 AI 助手,文章可以一键翻译,支持快速定位原文,降低阅读门槛。遇到不会的概念,可直接询问 AI 并获得回答及索引来源,方便跳转阅读。同时,具有搜索增强能力,能根据文档本身提供细节问题的答案及延展问答。 360AI 浏览器的翻译效果好,基本实现对原有 PDF(PPT)的内容翻译替换,尽量维持原有的阅读体验,可免费使用高质量的沉浸式翻译。 此外,360AI 浏览器对于英文 PDF 的阅读与整理能力较强,能正确获取和理解 PDF 的内容。它还有自动生成思维导图等功能,在阅读长文需要总结概括或文档解释时,网页右侧就有 AI 贴心助手,提供文章简介、重点和问答。并且还有许多小细节处理得很好,如文章朗读、全屏沉浸式阅读、直接保存为图片或 PDF、修改字体字号等。
2024-08-12
多智能体适合在什么场景下应用
多智能体适合应用的场景较为广泛,常见的有以下几种: 1. 集中式调度:适用于需要全局协调的场景,如机器人协作、交通管制等。在这种模式下,有一个中央控制器负责收集所有智能体的信息,并做出整体最优的决策和资源分配。 2. 分布式调度:常用于大规模、动态、开放的系统,如传感器网络、P2P 网络等。每个智能体根据本地信息和与其他智能体的交互来做出决策,无需中央控制器。 3. 市场驱动调度:适用于电力负载调度、计算资源分配等领域。智能体通过竞价机制获取资源和任务分配,类似于现实市场的供需规律。 4. 约束优化调度:适用于任务分配、资源规划等约束严格的场景。将多智能体协作问题建模为分布式约束优化问题,通过启发式或完全算法求解近似最优解。 5. 组织结构调度:常见于多机器人协作、组织自动化系统中。根据特定的组织拓扑结构(层级、同辈、联盟等)对智能体角色和协作模式进行规范,实现有序调度。 6. 基于规范协议的调度: 此外,以旅游场景为例,在设计需要多轮协作的智能体时,比如设计分别负责景点推荐、路线规划和食宿安排的三个智能体,应在多智能体编排页面中设计为一个闭环结构,确保用户在整个对话过程中能够自由地在不同智能体之间切换。同时,要注意跳转设置问题,扣子在节点切换提供了独立和非独立两种识别模式。
2024-08-12
哪个AI工具能够较好翻译pdf大文本。
以下是一些能够较好翻译 PDF 大文本的 AI 工具: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 此外,360AI 浏览器不仅内嵌了强大的 PDF 编辑工具,还内嵌了 ChatPDF 的强大 AI 助手,文章可以一键翻译,且支持快速定位原文,大幅降低阅读门槛。遇到不会的概念,可以直接询问 AI,AI 会快速给你回答,且定位其索引来源,方便跳转阅读。并且具有搜索增强能力,除了可以根据文档本身针对细节问题提供答案,同时也可以给予一些延展问答。360AI 浏览器已向用户免费开放 100 万字长文本阅读功能,正在内测 500 万字长文本处理功能。当打开视频网站时,还可以选择唤起 AI 助理,辅助快速了解文章主体内容。 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-08-12
sd和mj各自的优缺点在哪?分别更适合什么样的工作内容
Midjourney(MJ)的优点: 1. 角色一致性精度较高,对于 70 80%的工作能大幅提升效率。 2. 高可用性、极佳的用户体验、不错的效果。 3. 不需要像 Stable Diffusion(SD)一样高门槛、高成本地训练自己的 LoRA,只需要一张图。 4. 能生成更多样、更具设计感的角色设计,不受制于特定的模型风格。 5. 有更加可控的设计内容和更多的细节调整空间,比如使用 Midjourney + Stable Diffusion 混合模式进行原画设计,有两到三次的 Prompt 调整空间,并且能够运用 SD Controlnet 的各种功能对设计细节进行更多更细致的调节。 6. 可以产出比单纯使用一种 AI 进行设计更加合理的结构和更丰富的细节。 7. 效率极高,在使用合适的 Prompt 情况下,使用较好的硬件,一个完整的方案产出示例不会超过十五分钟。 8. 能极大地避免可能造成的版权争议和信息泄露风险。 Midjourney(MJ)的缺点:可能还达不到绝对一致性的标准。 Midjourney(MJ)更适合的工作内容:首当其冲的是所有非真人领域,比如游戏、漫画、动漫、绘本等,在商业领域和专业工作流中也有一席之地。 Stable Diffusion(SD)的优点: 1. 提示词占比相对较低,模型和参数及插件占比较高,分别为 30%和 40%,有更多可调节的空间。 Stable Diffusion(SD)的缺点:提示词的重要性相对较低,需要高门槛、高成本地训练自己的 LoRA。 Stable Diffusion(SD)更适合的工作内容:暂无明确提及。
2024-08-12
找一些实时翻译网页的插件
以下是为您推荐的一些实时翻译网页的插件和工具: 1. DeepL(网站): ,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件): ,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」 。 3. calibre(电子书管理应用): ,下载并安装 calibre,并安装翻译插件「Ebook Translator」 。 4. 谷歌翻译(网页): ,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页): ,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App),下载后点击「文档翻译」,可以直接导入 PDF、PDF、Word、Excel、PPT、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App),下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 8. 浏览器自带的翻译功能,如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。 此外,还有 RTranslator 这款开源、免费离线的实时翻译应用,可实现多人、多语言的实时对话翻译,对话模式通过对方的手机或蓝牙耳机播放,包括对话模式、对讲机模式和文本翻译三种模式,链接: 。
2024-08-12
学习AI3D建模,那些平台更实用
目前在学习 AI 3D 建模方面,以下几个平台较为实用: 1. Blender:功能强大且开源免费,拥有丰富的插件和教程资源。 2. Maya:广泛应用于影视、游戏等领域,提供了全面的建模工具和强大的渲染功能。 3. 3ds Max:在建筑可视化、游戏开发等方面表现出色,具有易于上手的操作界面。 4. ZBrush:专注于数字雕刻,适合创建高精度的模型细节。 您可以根据自己的需求和学习偏好选择适合您的平台。
2024-08-12