Navigate to WaytoAGI Wiki →
Home/All Questions
数字员工
数字员工是基于大语言模型为大脑,串联所有已有的工具和新造的 AI 工具的智能体。 在成为基于 Agent 的创造者方面,数字员工的学习路径包括: 1. 学历(大模型):掌握大模型相关知识。 2. 察言观色(观察):具备观察能力。 3. 逻辑思维(推理):拥有推理能力。 4. 执行(SOP):遵循标准操作流程执行任务。 Agent 工程(基础版)的范式包括: 1. 梳理流程:梳理工作流程 SOP,并拆解成多个单一「任务」和多个「任务执行流程」。 2. 「任务」工具化:自动化每一个「任务」,形成一系列的小工具,让机器能完成每一个单一任务。 3. 建立规划:串联工具,基于 agent 框架让 bot 来规划「任务执行流程」。 4. 迭代优化:不停迭代优化「任务」工具和「任务执行流程」规划,造就能应对实际场景的 Agent。 数字员工的“进化论”方面,需要在固化流程和让 AI 自主思考之间,在对 AI 能力基础上作出妥协和平衡。 在摊位信息中,有关于 AI 数字员工的摊位,其主题为为企业和个人提供数字劳动力,解决重复性、创意性工作难题,体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。 序智科技是一家人工智能创业公司,基于大模型技术打造数字劳动力平台。其招聘后端开发工程师的职责包括参与公司后端服务的设计、开发和维护,优化后端架构,提升系统性能和稳定性等。要求计算机相关专业本科及以上学历,有 3 年以上后端开发经验等。同时也招聘前端开发工程师。
2025-03-24
Runway
以下是关于 Runway 的详细介绍: 网页:https://runwayml.com/ 注册: 零门槛注册,在右上角 Sign Up 处输入邮箱与基础信息,完成邮箱验证即可。新注册用户会有 125 个积分进行免费创作(约为 100s 的基础 AI)。 生成第一个视频的步骤: 1. 选择左侧工具栏“生成视频”。 2. 选择“文字/图片生成视频”。 3. 将图片拖入框内。 4. 选择一个动画系数。 5. 点击生成 4 秒视频。 6. 下载视频。 优势: 1. 拥有强大的底层模型,能够理解复杂的视频生成需求,并转化为高质量的视频输出。 2. 生成的视频质量高,画面清晰、动作流畅、内容连贯,能满足普通用户需求,也为专业创作者提供支持。 3. 团队持续进行技术迭代和更新,保持在视频 AI 技术前沿,提供最新、最强大的功能。 存在的问题: 1. 共用账号或生成特别好的视频时,生成队列相对较短,使用高峰期可能需等待一段时间才能开始新的视频生成任务。 2. 某些时段生成速度可能变慢,影响用户使用体验,尤其对需快速生成视频的用户。 此外,11 月 25 日的 Xiaohu.AI 日报提到 Runway 发布新图像生成模型 Frames,专注打造特定美学和视觉氛围,支持细粒度控制“外观、感觉和氛围”,强调“世界构建”,可设计完整的视觉世界,包括场景、氛围、情感等,提供全面的视觉叙事支持,帮助用户创建统一风格、独特审美的艺术世界,适配故事或项目需求。详细介绍:
2025-03-24
有没有特别好用的做小红书的AI工具
以下是一些好用的做小红书的 AI 工具: 军刀、口红唇彩。 推荐的工具案例: ,体裁为视频,点赞 1.8 万,优点是说明了工具的使用场景和最大优点,结构清楚不拖沓。 ,体裁为视频,点赞 6000,视频制作专业,文稿结构清晰简洁,推荐所有人跟练。 ,体裁为图文,点赞 2.7 万。 此外,还有以下体验相关的案例: ,体裁为视频,点赞 1800,优点是第一人称视角,环节清晰简单,没有多余废话,稀缺性描述到位。 ,体裁为视频,点赞 6000,优点是第一人称视角很重要,感同身受,最有视觉震撼的部分做得很好。 ,体裁为视频,点赞 1100,优点是听觉体验好,当时 AI 写歌有稀缺性,站内类似内容少,容易有人围观。 另外,还有以下搜索与信息获取相关的工具: Felo/点点: Felo 是浏览器插件,会自动调用小红书网页搜索获取笔记内容,然后引用小红书的笔记内容来回答问题,输出的攻略详尽,使用结构化语言梳理路径,比直接看博主笔记高效,因为小红书博主笔记通常会使用 emoji 干扰信息,排版也不够清晰。 秘塔 AI 搜索的回答质量比 Felo AI 差,因为引用的内容质量不高。 小红书推出了自家的 AI 搜索产品“点点生活搜索助手”,目前在内测中,可在微信小程序上搜索“点点生活搜索助手”。用点点搜索回答问题时会插入相应图片,免去重新打开笔记看图片的麻烦,比如搜索“MacOS 开热点的教程”,结尾还配了视频。有了 Felo AI 配合点点生活搜索助手,查攻略效率能大幅提升,在电脑微信上也可使用点点的微信小程序。
2025-03-24
AI数字员工
AI 数字员工是为企业和个人提供数字劳动力,能够解决重复性、创意性工作难题。其体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。 结合“一人公司”的愿景,需要大量智能体(数字员工)替我们工作。未来的 AI 数字员工会以大语言模型为大脑,串联所有已有的工具和新造的 AI 工具。 创造者的学习方向是用大模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。Agent 工程(基础版)如同传统的软件工程学,有迭代的范式,包括梳理流程、“任务”工具化、建立规划、迭代优化。 在数字人方面,算法驱动的数字人涉及 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition 等)、AI Agent(大模型如 ChatGPT、Claude 等,Agent 部分可使用 LangChain 的模块自定义)、TTS(如微软的 edgetts、VITS、sovitssvc 等)。人物建模模型可通过手动建模或 AIGC 方式生成人物动态效果。但简单的构建方式存在如生成指定人物声音、TTS 音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等问题。
2025-03-24
怎么用AI做电商
以下是关于如何用 AI 做电商的一些方法和应用场景: 在商品展示方面,可以利用 AI 绘画工具如 Stable Diffusion 来制作商品展示图。对于女装商品,可先让真人穿衣服拍照,获取真实质感的照片。选好真人照片风格的底模,如 majicmixRealistic_v7,并根据不同平台需求进行换头操作,如面向海外市场换白女头。在图生图下的局部重绘选项卡下涂抹需要替换的部分,并设置合适的 prompts 和 parameters。 在电商运营中,AI 有多种应用场景: 1. 产品推荐:通过分析客户数据,为每个客户推荐可能感兴趣的产品。 2. 搜索和个性化:改善搜索结果,提供个性化的购物体验。 3. 动态定价:根据市场需求动态调整产品价格。 4. 聊天机器人:提供服务,回答客户问题并解决问题。 此外,还可以利用 AI 数字人带货本地生活电商: 1. 用 ChatGPT 生成短视频选题文案,明确身份、描述需求和回答要求。 2. 用 ChatGPT 生产短视频文案,结合需求与框架。 3. 生成虚拟数字人短视频:打开相关网站,输入内容,选择头像、国家和声音,等待生成后结合产品讲解并发布进行视频带货。
2025-03-24
提示词
以下是关于提示词的全面介绍: 一、什么是提示词 1. 用于描绘您想生成的画面。 2. 输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),且支持中英文输入。 3. 启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。 二、如何写好提示词 1. 可以点击提示词上方官方预设词组进行生图,提示词内容要准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 2. 调整负面提示词,点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解我们不想生成的内容,比如:不好的质量、低像素、模糊、水印。 3. 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先,也可对已有的提示词权重进行编辑。 4. 辅助功能包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 三、提示词要素 提示词可以包含以下任意要素: 1. 指令:想要模型执行的特定任务或指令。 2. 上下文:包含外部信息或额外的上下文信息,引导语言模型更好地响应。 3. 输入数据:用户输入的内容或问题。 4. 输出指示:指定输出的类型或格式。 四、提示工程与提示词的区别 提示工程是一个相对较新的概念,涉及设计和优化输入提示以引导 AI 模型生成特定类型的输出或执行特定的任务。其关键点包括精确性、创造性、迭代、上下文理解。提示词通常指直接输入到 AI 模型中的问题、请求或指示,是提示工程的一部分。提示工程是一个更广泛的概念,不仅包括创建提示词,还涉及理解模型的行为、优化提示以获得更好的性能、以及创造性地探索模型的潜在应用。提示工程的目标是最大化 AI 模型的效用和性能,而提示词是实现这一目标的手段之一。在实际应用中,提示工程可能包括对 AI 模型的深入分析、用户研究、以及对特定任务的定制化提示设计。
2025-03-24
Generate the prompt to analysis the long-text working paper: First, give me a concise and accurate abstract of this paper less than 500 words;
以下是为您生成的分析长文本工作论文的提示: 摘要: 本文主要讲述了作者在利用 GPT4 生成文章时的经历和探索。包括最初对 Claude 2 分析章节结构的尝试效果不佳,后来在生成章节内容时采用循环结构并让 GPT4 判断是否调用插件搜索信息。过程中遇到诸多困难,如插件效果不稳定、搜索等待时间长等,最终通过在需要搜索网络信息的章节处打上标签解决问题。同时还提到大型语言模型在总结文本方面的应用,如在 Chat GPT 中总结文章,以及针对产品评论进行摘要的任务。此外,还介绍了让 Claude 2 以特定格式回答带有引用来源问题的方法。 提示: 1. 对于文章内容的分析,先梳理整体框架,明确各部分的主题和重点。 2. 关注作者在实践过程中的关键步骤、遇到的问题及解决方案。 3. 注意不同模型和插件在应用中的特点和差异。 4. 总结文本应用方面,关注不同场景下的具体需求和实现方式。 5. 对于引用相关的内容,理解其格式要求和回答规范。
2025-03-24
从0到1学习ai
以下是从 0 到 1 学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库提供了很多大家实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-24
AGI是什么,这个网站能帮助我做什么
AGI 即通用人工智能(Artificial General Intelligence),是指具备像人类一样广泛的认知能力和智能水平的人工智能。 关于本网站,它具有以下功能: 1. 和 AI 知识库对话:您可以在这里询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,您可以按需求找到适合您的工具。 3. AI 提示词:集合了精选的提示词,您可以复制到 AI 对话网站来使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 此外,本网站还提供了一个全面系统的 AI 学习路径,帮助您了解从 AI 常见名词到 AI 应用等各方面知识。并且,本网站旨在让每个人的学习过程少走弯路,让更多的人因 AI 而强大。 例如,Web3 和人工智能初创公司 AGII 获得 1500 万美元融资,AGII 是一个 AI 驱动的平台,赋予用户轻松生成各个领域高质量内容的能力,提供一系列 AI 生成器和魔法工具,包括文本、图像、代码、聊天机器人、语音转文本和配音等功能,旨在帮助内容创作者、营销人员和企业以更短的时间创造引人入胜且有影响力的内容。 本网站还有多种渠道同步相关内容,如公众号“通往 AGI 之路”、B 站、小红书、X(Twitter)等。
2025-03-24
将2D图生成3D模型的AI是什么
以下是一些能够将 2D 图生成 3D 模型的 AI 相关信息: 有几个团队正在追求根据文本或图像提示轻松生成纹理的机会,包括 BariumAI(https://barium.ai/)、Ponzu(https://www.ponzu.gg/)和 ArmorLab(https://armorlab.org/)。 微软与 blackshark.ai(https://blackshark.ai/)合作,并训练了一个 AI 从 2D 卫星图像生成逼真的 3D 世界(https://blackshark.ai/solutions/)。 生成性 AI 可以为游戏创建 2D 艺术、纹理、3D 模型,并协助关卡设计。
2025-03-24