Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

人形机器人如何入门

Answer

要入门人形机器人,以下是一些关键的方面:

  1. 了解具身智能的概念:具身智能是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。人形机器人是具身智能的代表产品。
  2. 掌握具身智能的要素:包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),且三者高度耦合是高级智能的基础。
  3. 熟悉具身智能的模块:具身智能体的行动分为“感知-决策-行动-反馈”四个步骤,分别由四个模块完成,并形成一个闭环。
  4. 关注相关技术进展:例如在 AI 3D 生成领域的进展对具身智能领域具有革命性意义,世界模型开启了在虚拟世界中预训练机器人的新可能,大幅降低试错成本,加速学习过程,为实现更复杂的机器人行为打开可能。
  5. 研究具体案例:如哥伦比亚大学创意机器实验室开发的人形机器人头,其能精准模拟人类面部表情,使用 AI 模型预测和回应人类表情,自我监督学习生成表情。
Content generated by AI large model, please carefully verify (powered by aily)

References

码观 | 共识与非共识:从模型到应用,2024 AI 趋势回首与展望

李飞飞如何做到这一点,目前仍然不能完全确定,但可以确定的是,行业在2024年一年,在AI 3D生成领域,有了很大的进展。高斯喷射、One-2-3-45等工作,极大地加速了AI 3D生成的进展。而通过对3D物体的生成,所构建出的世界,再进行降维的视频生成,生成的视频,自然符合物理世界的规律,生成的世界也可交互。这些进展对具身智能领域具有革命性意义。和任何AI训练一样,具身智能——也就是机器人的智能,想要变得更聪明,也需要大量数据。传统上,训练机器人需要在现实世界收集大量数据,这个过程极其昂贵且效率低下。这些数据要采集自现实世界,比如使用动作捕捉设备遥操作驱动机器人进行操作,常规的操作是配备一到两人,一个机器人,一套动捕装备和一个计算机,还需要大量的时间投入。而世界模型开启了一个新的可能:在虚拟世界中预训练机器人。这个虚拟世界完全符合物理规律,可以快速生成无限场景,支持并行训练多个任务。这将大幅降低试错成本。这不仅加速了机器人的学习过程,也为实现更复杂的机器人行为打开了可能。我们或许会在接下来几年看到,具身智能突然出现像过去语言模型、视觉模型得到大量数据后出现的跨越式发展。这种进步正在催生新的应用可能:更自然的人机交互界面、更安全的机器人控制系统、更高效的虚拟训练平台。在制造业、虚拟现实、机器人技术等领域,世界模型都可能带来革命性的变革。世界模型也在改变AI理解和交互世界的基本方式,从表面特征的识别提升到深层物理规律的理解,从静态的判断发展到动态的预测,从单一模态扩展到多维度感知。模型开始真正理解和模拟这个世界的运行规律,这或许是通向真正“人形机器人”的关键一步。

一篇具身智能的最新全面综述!(上)

具身智能,即“具身+智能”,是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以ChatGPT为代表的“软件智能体”(或称“离身智能体”)使用大模型通过网页端、手机APP与用户进行交互,能够接受语音、文字、图片、视频的多种模态的用户指令,从而实现感知环境、规划、记忆以及工具调用,执行复杂的任务。在这些基础之上,具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流,强调智能体与物理环境之间的交互。通俗一点讲,就是要给人工智能这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机,可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体,是具身智能的代表产品。具身智能的三要素:本体、智能、环境具身智能的三要素:“本体”,即硬件载体;“智能”,即大模型、语音、图像、控制、导航等算法;“环境”,即本体所交互的物理世界。本体、智能、环境的高度耦合才是高级智能的基础。不同环境下的会有不同形态的硬件本体以适应环境。比如室内平地更适用轮式机器人,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器以感知环境,做出决策以操控本体执行动作任务,从而影响环境。在智能算法与环境的交互中还可以通过“交互学习”和拟人化思维去学习和适应环境,从而实现智能的增长。具身智能的四个模块:感知-决策-行动-反馈一个具身智能体的行动可以分为“感知-决策-行动-反馈”四个步骤,分别由四个模块完成,并形成一个闭环。

XiaoHu.AI日报

?https://x.com/imxiaohu/status/1774264556497588410?s=205⃣️?Emo-哥伦比亚大学创意机器实验室开发的人形机器人头:精准模拟人类面部表情,具有高分辨率眼部跟踪。使用AI模型预测和回应人类表情,自我监督学习生成表情。?https://engineering.columbia.edu/news/robot-can-you-say-cheese?https://x.com/imxiaohu/status/1774062241098465487?s=206⃣️?Living Images-自动优化网站图片:输入网址,自动改进图片吸引力,包括A/B测试。旨在提升用户行动,如点击、购买或注册。?http://coframe.ai?http://img.coframe.ai?https://x.com/imxiaohu/status/1773914481262997541?s=207⃣️?微软和OpenAI计划建造“星际之门”AI超级计算机:预计成本1000亿美元,旨在提供强大AI计算能力。将建造数百万服务器芯片的数据中心。?https://theinformation.com/articles/microsoft-and-openai-plot-100-billion-stargate-ai-supercomputer?https://x.com/imxiaohu/status/1773909540935029025?s=208⃣️?️OpenAI发布语音生成模型Voice Engine:根据文本和15秒音频样本生成自然语音。支持情感丰富的声音生成,多语种和保留口音。

Others are asking
有没有优质的系统的coze入门网课?
以下是一些优质的系统的 Coze 入门网课推荐: 另外,还有“一泽 Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力”,这可能是全网最好的 Coze 教程(之一),即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。其核心看点包括通过实际案例逐步演示用 Coze 工作流构建能够稳定按照模板要求生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法等。适合任何玩过 AI 对话产品的一般用户,以及希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。但需注意,本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。
2025-04-14
七天入门计划
以下是为您提供的七天入门 AI 的计划建议: 第一天: 开始接触李宏毅的生成式人工智能课程。 资源:在 B 站直接搜索《李宏毅 2024 春《生成式人工智能导论》。 第二天至第十四天: 抽空陆续花 2 周时间学完李宏毅的课程。 第五天: 研究并开始使用 Kimi。 参考资料: 。 抱着每天向 kimi 问 100 个问题的心态,调整自己的思考模式,在工作和生活中养成有问题问 AI 的习惯。您还可以参考公众号文章【每天问 Kimi 们 100 个问题,你就 AI 入门了】。 在学习过程中,建议做好笔记,总结所学知识和心得体会,以便更好地掌握和应用。
2025-04-13
给我提供一份清华大学104页的deepseek从入门到精通的手册的链接
以下是为您找到的与清华大学 DeepSeek 相关的一些资料链接: https://pan.quark.cn/s/56e2713e95f4 https://docs.qq.com/doc/DSG9SWFpjVXI3aHZ1 清华大学 104 页的 DeepSeek 从入门到精通的手册:https://waytoagi.feishu.cn/record/FjWorH (2 月 11 日更新附录)
2025-04-11
给我提供一份清华大学104页的deepseek从入门到精通的手册
以下是为您整合的相关信息: 清华大学出品了《DeepSeek:从入门到精通》的指南,该指南详细阐述了 DeepSeek 的功能,如智能对话、文本生成、代码生成、自然语言理解等,并探讨了其使用方法,包括推理模型与通用模型的区别、提示语设计策略等,旨在帮助用户更好地掌握这一 AI 工具的使用,提升工作效率和创新能力。您可以通过以下链接获取:https://waytoagi.feishu.cn/record/QAURr4CNGeJ5GIcvU0nc9X3dndg 。 此外,还有一些相关的更新和资料,如 2 月 11 日更新附录的清华大学 104 页 Deepseek 从入门到精通、1 月 21 日更新热门 AI deepseek 推荐及案例征稿通知、1 月 14 日更新爱好者交流 g 群和微信群、12 月 30 日更新案例 24,25,26 等。 同时还有关于 AI 赋能教学的课程实施流程及案例亮点等内容,如利用 AI 生成开放性问题引发深度思考、通过多维数据分析支持全面客观的判断、通过辩论提升批判性思维和表达能力等。
2025-04-11
入门:Ai绘画
以下是为您提供的 AI 绘画入门相关的资源和教程: 在“通往 AGI 之路介绍.pdf”中,有关于 AI 绘画入门的部分,包括产品工具与案例实战,开箱即用。 以下是一些 B 站的视频教程链接: 「AI 绘画」软件比较与 stable diffusion 的优势: 「AI 绘画」零基础学会 Stable Diffusion: 「AI 绘画」革命性技术突破: 「AI 绘画」从零开始的 AI 绘画入门教程——魔法导论: 「入门 1」5 分钟搞定 Stable Diffusion 环境配置,消灭奇怪的报错: 「入门 2」stable diffusion 安装教程,有手就会不折腾: 「入门 3」你的电脑是否跑得动 stable diffusion?: 「入门 4」stable diffusion 插件如何下载和安装?: 还有 SD 新手从 0 入门的 AI 绘画教程,包括以下章节: 第一节课:AI 绘画原理与基础界面 第二节课:20 分钟搞懂 Prompt 与参数设置,你的 AI 绘画“咒语”学明白了吗? 第三节课:打破次元壁!用 AI“重绘”照片和 CG 第四节课:AI 绘画模型,“画风”自由切换 第五节课:提高 AI 绘画分辨率的方式 第六节课:LoRa|Hypernetwork 概念简析 第七节课:定向修手修脸,手把手教你玩转局部重绘! 第八节课:提示词补全翻译反推,“终极”放大脚本与细节优化插件 第九节课:LoRA 从原理到实践 第十节课:零基础掌握 ControlNet! 您可以通过以上资源进行学习,祝您在 AI 绘画领域学有所成!
2025-04-10
AI入门
以下是为您提供的 AI 入门的相关指导: 一、Python + AI 入门 在深入学习 AI 时,编程可能会让您感到困难,尤其是对于不会代码的朋友。但别担心,这里有一份 20 分钟的简明入门指南,能帮助您更快掌握 Python 和 AI 的相互调用,并在接下来的 20 分钟内完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。 关于 Python: Python 就像哆啦 A 梦,拥有装满各种道具的标准库,遇到问题时可直接使用。若标准库道具不够,还能通过 pip 一类的工具从 GitHub 一类的分享代码平台订购新道具。Python 在 AI 领域被广泛使用,遍地是大哥。 关于 OpenAI API: OpenAI 通过两种方式提供服务,一是通过 ChatGPT 提供开箱即用的服务,直接对话即可;二是通过 OpenAI API 提供更加灵活的服务,通过代码调用完成更多自动化任务。 二、JavaScript 的 AI 堆栈入门 尽管当前版本是一个很好的起点,但仍在逐步完善,路线图包括: 1. 交互式 CLI 用于 createaistack,开发人员可选择自己的项目脚手架和依赖项。 2. 用于高级用例的事务性数据库(例如,在问答中保留问题、用户偏好等)。 3. 更多的向量数据库和部署平台选项。 4. 用于开源模型的轻量级微调步骤。 同时,对在创建过程中发挥重要作用的开源项目表示感谢,如 Tailwind、ai sdk、dotenv、Next.js、langchain.js 等。 三、新手学习 AI 的方法 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能及其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中,有一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,您可根据兴趣选择特定模块深入学习,一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。知识库中有很多大家实践后的作品、文章分享,欢迎您实践后也进行分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。
2025-04-10
结合北京房山区文化、地标建筑、生态景观等内容,设计房山区中小学数学节 LOGO,要求巧妙融合数学元素(如几何图形、数学公式、数学符号等)与 AI 元素(如神经网络图案、代码片段、智能机器人形象等),生动诠释 “数学 + AI=?” 的主题内涵。
以下是为您整合的相关内容: 北京具有丰富多样的特色元素,包括经典地标如万里长城、天安门广场、故宫角楼、天坛等,见证了历史变迁;宜居生活方面,有独特的美食如豆汁儿、脆皮烤鸭、老北京炸酱面,以及充满京腔的日常生活;潮流文化新地标如国家博物馆、胡同里的新老交融、环球影城、798 等;未来科技方面,有西二旗的上班族日常、北大化学系科研 vlog、世界机器人大会等。 在海报设计方面,若对 AI 回答有疑问可再搜索确认,对于想用的项目要确认与北京的关系及能否使用;兔爷、戏曲金句等北京有名元素可用,金句可分化。做海报时可借鉴三思老师毛绒玩具美食系列,先找参考、做头脑风暴。比赛征集内容有四个赛道,若做系列海报,围绕金句或偏向北京非遗项目做系列较简单。用 AI 制作海报时,如制作北京地标糖葫芦风格海报,可用集梦 2.1 模型,以天坛等建筑为画面中心,注意材质、抽卡选图和细节处理。 对于设计房山区中小学数学节 LOGO,您可以考虑将房山区的特色文化、地标建筑、生态景观与数学元素(如几何图形、数学公式、数学符号等)和 AI 元素(如神经网络图案、代码片段、智能机器人形象等)相结合。例如,以房山区的著名建筑为主体,融入数学图形进行变形设计,同时添加一些代表 AI 的线条或图案,以生动诠释“数学 + AI=?”的主题内涵。
2025-03-18
AI在未来运用在人形机器人上能实现什么
在未来,AI 运用在人形机器人上能够实现以下方面: 1. 为人类生活带来更智能、更便捷的体验,提供各种生活服务和生产制造服务。 2. 打造能够与人类建立深度互动的智能体,自主处理与复杂物理世界的交互。 3. 利用端到端的 AI 运动控制技术驱动软硬件一体化的机器人系列产品,开发在真实世界中生产、制造以及服务的人形机器人产品。 4. 拥有先进的计算机视觉算法、人工智能算法、控制和路径规划算法,对 3D 物体的姿势估计具有出色的感知能力。 5. 可以为机器人提供模仿训练数据,人形机器人可能在人类世界中更加有用,部署更加高效。 6. 借助相关技术,人形机器人能够从少量人类演示中学习,帮助完成日常任务,通过观察模仿人类的运动。 7. 由全新的机器人芯片提供支持,实现更强大的智能功能。
2024-09-30
怎么学习人形机器人相关知识
以下是一些学习人形机器人相关知识的途径和资源: 1. 关注 Xiaohu.AI 日报:其中提到了 Alter3 人形机器人,由东京大学开发,由 GPT 4 驱动,可以自主进行各种人类动作,如自拍姿势,还能通过口头反馈调整姿势、表达情感,并且涉及程序代码转换,将动作语言描述转为机器人执行代码。相关链接:https://x.com/xiaohuggg/status/1734492844545683636?s=20 2. 了解黄仁勋在 AI 界超级碗 GTC2024 的主旨演讲:其中提到为机器人提供模仿训练数据,人类和人形机器人构建方式相似,人形机器人能学习适应物理世界等内容。 此外,您还可以通过以下方式深入学习人形机器人知识: 1. 阅读相关的学术文献和研究报告,了解人形机器人的技术原理和发展趋势。 2. 参加专业的学术会议和研讨会,与行业专家和学者交流。 3. 在线课程平台上寻找关于人形机器人的课程进行系统学习。 4. 关注相关的科技博客和论坛,获取最新的行业动态和技术分享。
2024-09-20
用什么软件可以生成个人ai数字人形象?
以下为您介绍可以生成个人 AI 数字人形象的软件及方法: 剪映 App 可以帮助您生成数字人形象。在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放其声音,您可判断是否需要,然后点击右下角的“添加数字人”,软件会根据之前提供的内容生成对应音视频并添加到当前视频中。左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 生成数字人后,您还可以进行以下操作来完善视频: 1. 增加背景图片:删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频长度对齐,再调整图片大小和数字人的位置。 2. 增加字幕:点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 如果您希望数字人换成自己希望的面孔,可以使用 facefusion 软件。打开该软件,返回实例列表,点击自定义服务按钮,通过新的浏览器窗口访问其 UI 界面。上传准备好的图片和视频,在右侧可看到预览效果,点击下方的开始按钮执行换脸处理。处理完成后,在输出位置点击下载按钮导出换脸后的视频。 整个过程大约 10 分钟,制作数字人视频免费,数字人换脸约 0.8 元。
2024-07-19
社群机器人
以下是关于社群机器人的相关内容: 制作 Coze 社群机器人的大致流程看似步骤繁多,但由于 Coze 本身的设计和强大的社区力量,实际操作并不复杂,关键是要“迈出第一步”。在制作过程中,与社区成员设计方案时的深入讨论、在 Coze 平台上灵活组装功能时的高效畅快以及在不断调试优化中见证机器人成长,都充满乐趣。未来会有更多社区加入制作社群机器人的行列,让更多人感受 AI 智能体的魅力,那时的社群机器人不仅是助手,更是凝聚社区集体智慧的伙伴。目前的社区机器人还有不足,作者会继续优化,看其能否更好地服务社区。 如果对学习 Coze 和 AI Agent 有兴趣,可以加入免费的 AI Agent 共学群,该群组会基于 WaytoAGI 社区等高质量信息源分享相关玩法、经验和前沿资讯。可搜索微信号 Andywuwu07 或扫描二维码加微信,备注 AI 共学以便被拉入群。 此外,以综合服务的社群机器人为例,一个好的文章或复杂任务不是一次 AI 工作就能完成的,需要任务拆解,比如对用户问题做意图判断,根据意图将线路转接到正确的专属 AI 机器人那里,整个过程称为工作流,通过搭建工作流来完成复杂任务。
2025-04-15
MacBook 如何做一个 RPA 机器人
以下是在 MacBook 上制作 RPA 机器人的详细步骤: 搭建前准备: 硬件准备: MacBook(需能科学上网) 一部 iPhone 手机 主板 Arduino UNO R4 Wifi(200RMB) 舵机 9g(32RMB) 杜邦线,公对公 7 条(手残党可多备) (可选)八爪鱼支架(10RMB) (二选一)usbtypeC 转接头,或一根两头 typeC 的线 Arduino UNO R4 WIFI 开发板 MG90s/SG90 舵机 9g 云台支架 可选八爪鱼手机支架 杜邦线公对公 搭建步骤: 完成代码: 在 Github 上下载完整代码。 根据需求修改文件: 【必改】在 head.py 中找到填写主板串口的地方,改成串口地址(可通过主板写入的第 3 步里的小字或 Tools>Get Board Info 重新查询,复制 sn 号替换 usbmodem 后面的编码)。 【必改】查询 iPhone 的 ip 地址,填到 talk.py 里(iPhone 设置>无线局域网>点击当前 wifi 旁的感叹号>找到 ipv4 地址里写的 ip 地址)。 【必改】把 open ai key 填到 talk.py 里。 【可选】在 talk.py 里,可以修改: Openai 调用的 model。 system prompt(机器人的人设)。 机器人的音色。 录音的设置。 【可选】在 head.py 里,可以修改不对话后,等待多久恢复人脸追踪。 运行程序: 在 MacBook 上按下 command+space(空格)打开一个新的终端,依次输入如下代码(每一次代码运行完以后再输入下一个),全部完成后,关闭端口。 将 iPhone 的屏幕关闭时间设置为 5 分钟或永不。 打开 iPhone 的 pythonista 并复制 face.py 的代码进去,运行。注意:每一次如果需要重新运行 pythonista,请先杀后台再运行,否则会因为端口已经被占用而无法播放声音。 找到下载下来的 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”。 将 arduino R4 与 MacBook 相连,在终端中输入以下代码,运行后程序会申请一次摄像头权限,点击允许,然后出现运行失败,再运行一次即可。这个程序一旦运行,无法自然退出,建议直接拔掉 R4 的线或者终端输入 control+c 或者直接关闭终端,但多强制退出几次以后运行就会卡住需要重启或清进程。 再次在 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”,在终端中输入以下代码,运行后程序会申请一次录音权限,点击允许,然后出现运行失败,再运行一次即可。如果运行中出现任何报错,将本文档,代码,报错信息给到 GPT4,让他帮助你就好~可能是有一些库没有预装。 把 talk.py 的终端放在最前面你能看到,出现 recording...的时候就可以说话了。 三个程序同时运行、iPhone 和 MacBook 在同一 wifi,iPhone 没有调静音的情况下,就可以正常对话啦。
2025-04-11
怎么搭建微信机器人?
以下是搭建微信机器人的步骤: 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。 2. 如果想为这个 AI 赋予提示词,可以返回相应步骤进行更改。例如在“目录 4 里的第 17 步”或“第三章,第 7 步”,其中双引号内的 value 部分,便是设置 AI 提示词的地方。 3. 此后,进行任何更改,都需要重新打印登陆二维码。并且一个月内,不要上来就加好友、最好不要私聊聊天。 4. 报错"wxsid"是因为微信未实名,实名即可解决。 5. 如果没有手机登录,可以使用夜神模拟器模拟手机登录。 6. 重新在“文件”的【终端】里,直接输入 nohup python3 app.py&tail f nohup.out 重新扫码登录。 7. 多次重新登录后,就在宝塔“首页右上角点击重启,重启一下服务器”,清理进程。 8. 熟悉 linux 操作的话,也可以通过重启进程的方式来重启服务。 9. 如果想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 此外: 1. Link AI 提供的 100 个,合计 3500 万 GPT3.5 Token 的礼品码。可以用来实现画图、搜索、识图等功能,COW 插件里几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里,领兑换码。 2. 添加微信,拉您进机器人群,先行体验。 如果您仍旧遇到问题,可以先查询社区知识库,或者加“通往 AGI 之路”群,社区小伙伴们会尽力帮助。也可以加 Stuart 个人微信询问。
2025-04-11
创建飞书ai机器人
创建飞书 AI 机器人的步骤如下: 1. 工作流搭建: 打开 Comfyui 界面后,右键点击界面,即可找到 Comfyui LLM party 的目录,您既可以学习如何手动连接这些节点,从而实现一个最简单的 AI 女友工作流,也可以直接将工作流文件拖拽到 Comfyui 界面中一键复刻。 2. 飞书机器人创建: 飞书应用建立: 在中创建自建应用。 进入应用获取 app_id 与 app_secret。 添加应用能力>开启机器人应用能力。 权限管理>消息与群组>选择需要的权限打开。 安全设置>将 comfyUI 运行的电脑 IP 加入白名单。 发布机器人以应用生效。 获取群组或用户 id: 要先把创建的机器人拉到群组中或者拉进私聊。 飞书开发平台找到发送消息的开发文档。 右侧点击获取 token。 选择 receive id type,chat_id 对应群组,open_id 与 user_id 对应个人,点击选择成员,复制对应的 id 即可。 如果需要让机器人发送语音,需要自行在电脑上安装 ffmpeg 。
2025-04-11
微信机器人如何配置
微信机器人的配置步骤如下: 1. sum4all 配置 进入插件目录:/root/chatgptonwechat/plugins 找到 sum4all 插件目录下的 config.json.template,复制并粘贴重命名为:config.json 注册并获取 sum4all key:https://pro.sum4all.site/register?aff=T6rP ,新用户注册有送免费额度,大家先使用这个进行试用,后续可改为自己的 openAI key。 把复制的 key,粘贴到 sum4all 的 config.json 文件内。(上方有功能阐述,你想要哪个,就把哪个改成 ture) 2. Apilot 配置 进入插件目录:/root/chatgptonwechat/plugins 找到 Apilot 文件下的 config.json.template,复制并粘贴重命名为:config.json 去 https://admin.alapi.cn/account/center 注册,并复制 key 把复制来的 key,粘贴进入。保存。 3. 分段对话配置替换 找到这个路径:/root/chatgptonwechat/channel/wechat,直接下载以下文件进行替换。 此外,微信的配置相对较简单,只需要主项目的 config.json 文件看看是否有"channel_type"参数,参数值为:"wx",即:"channel_type":"wx"。完成以上所有配置部分后,可以准备启动步骤了: 使用 nohup 命令在后台运行程序。 执行完启动脚本,等待 30s 左右,会看到终端有一个微信登录的二维码,微信扫码登录。 如果您想使用更多辅助功能,比如使用总结文件能力,总结网页内容能力,此时需要安装各种插件。这部分配置查看插件配置管理部分。
2025-04-10
利用飞书多维表格,做一个类似于客服机器人 可以怎么做?
利用飞书多维表格做一个类似于客服机器人,可以按照以下步骤进行: 1. 创建一个拟人化的 bot,比如起名叫青青,设定其为人设是一个可爱有趣的少女,擅长回答各种刁钻的问题。完成 BOT 捏好后点击发布。 2. 发布时配置飞书多维表格: 输出为文本时,第一步配置为文本。 配置多维表格输入表单,选择用控件的字段选择器,给字段标题随便起个名字如“question”。 在完善捷径的商家信息这里,可以选择全量发布,也可以选择仅自己可用。为了审核快一些,可以选择仅自己可用。等审核通过之后,就可以在飞书多维表格里面看到发布成功。 3. 还可以探索字段捷径的各种玩法(不含 bot),比如直接创建一个多维表格,第一列是几个成语,第二列是 AI 字段捷径生成的对成语的解释。左边输入一列,比如一列成语,右边配置 AI 字段。 此外,还有一些相关信息供您参考: “Show Me 扣子 AI 挑战赛大消费行业专场圆满落幕,探索 AI 与大消费行业的深度结合”中提到了一些相关作品,如帮助企业快速建立产品智能客服体系、ERP 高智版:扣子销售订单管理大师、亚马逊商品评论智析、AI 电商设计师等。 2024 年历史更新(归档)中包含了关于飞书多维表格字段捷径配置 COZE 的 BOT 青青的相关内容。
2025-04-08