Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

普通人怎么研发制作机器狗?

Answer

普通人研发制作机器狗具有很大的挑战性,需要具备多方面的知识和技能。以下是一些关键的步骤和要点:

首先,要了解具身智能的概念。具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。人形机器人是具身智能的代表产品,而机器狗作为一种具身智能体,其研发涉及到“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界)三要素的高度耦合。

不同的环境需要不同形态的硬件本体来适应。例如,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器感知环境,做出决策以操控本体执行动作任务,从而影响环境。

在研发过程中,还需要关注以下方面:

  1. 感知-决策-行动-反馈的四个模块,形成一个闭环,以实现机器狗的有效行动。
  2. 模拟训练环境的运用,例如像 Jim 团队在模拟环境中训练机器狗,并通过特定的代理和技术,将其转移到现实世界中。
  3. 脑电波控制技术,如 MIT 研究团队通过特殊眼镜读取脑电波和眼动来控制波士顿动力机器狗,这为控制方式提供了新的思路。

然而,对于普通人来说,要完成机器狗的研发制作,还需要足够开放的环境、大规模预训练数据和强大的基础模型,这是非常困难的。但如果您有强烈的兴趣和决心,可以通过学习相关的专业知识,逐步积累经验来尝试。

Content generated by AI large model, please carefully verify (powered by aily)

References

一篇具身智能的最新全面综述!(上)

具身智能,即“具身+智能”,是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以ChatGPT为代表的“软件智能体”(或称“离身智能体”)使用大模型通过网页端、手机APP与用户进行交互,能够接受语音、文字、图片、视频的多种模态的用户指令,从而实现感知环境、规划、记忆以及工具调用,执行复杂的任务。在这些基础之上,具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流,强调智能体与物理环境之间的交互。通俗一点讲,就是要给人工智能这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机,可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体,是具身智能的代表产品。具身智能的三要素:本体、智能、环境具身智能的三要素:“本体”,即硬件载体;“智能”,即大模型、语音、图像、控制、导航等算法;“环境”,即本体所交互的物理世界。本体、智能、环境的高度耦合才是高级智能的基础。不同环境下的会有不同形态的硬件本体以适应环境。比如室内平地更适用轮式机器人,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器以感知环境,做出决策以操控本体执行动作任务,从而影响环境。在智能算法与环境的交互中还可以通过“交互学习”和拟人化思维去学习和适应环境,从而实现智能的增长。具身智能的四个模块:感知-决策-行动-反馈一个具身智能体的行动可以分为“感知-决策-行动-反馈”四个步骤,分别由四个模块完成,并形成一个闭环。

智变时代 / 全面理解机器智能与生成式 AI 加速的新工业革命

因此需要足够开放的环境、大规模预训练数据和强大的基础模型。就在不久前,Jim在X上放出了一段演示,他们的团队在模拟环境中训练了一只机器狗,在瑜伽球上保持平衡和行走,然后将其转移到现实世界中,没有任何微调,行走的非常流畅。这个过程中团队用了DrEureka,一个LLM代理,它能编写代码在模拟中训练机器人,弥补仿真到现实的差距,完全自动化了从新技能学习到现实世界部署的全流程。在现实世界AI的另一端,Tesla正计划使用两万个Nvidia H100 GPU进行FSD 12新版本的训练,自家的用于Dojo超级计算机的D1芯片台积电也开始量产。D1由5x5阵列的高性能芯片组成,通过TSMC的InFO_SoW技术互联,通俗理解就是在一个单晶元上刻25个芯片,它们能像单一处理器一样高效工作。Tesla会用这个组成新的Dojo加速计算阵列,能达到100 exaFLOPS的计算能力,将其用来训练未来的FSD和FSD for Optimus。Nvidia和Tesla正在用各种不同的方式让AI进入物理世界,Nvidia提供通用模型和模拟训练环境,让第三方来生产机器人;Tesla则是从训练到制造全部自己来,这就像个人电脑时代的IBM兼容机和Mac一样,到底谁能胜出呢?拭目以待?配图3.12:Coatue的人形机器人价值对比图

XiaoHu.AI日报

1️⃣?Apple Vision Pro即将发售:-预计1月19日开启预购,2月2日正式发售。-售价从3499美元起。?https://x.com/xiaohuggg/status/1744367318921069019?s=20 2️⃣?️Midjourney面临集体诉讼:-未经许可使用16000名艺术家作品风格训练图像生成AI。-涉及现代艺术家、商业插画师及6岁儿童作品。-艺术家寻求法律援助,对Midjourney提起诉讼。?https://x.com/xiaohuggg/status/1744337216548295062?s=20 3️⃣?MIT研究团队开发Ddog技术:-通过脑电波控制波士顿动力机器狗。-使用特殊眼镜读取脑电波和眼动。-可辅助ALS、脑瘫和脊髓损伤患者。?https://x.com/xiaohuggg/status/1744296052029870124?s=20 4️⃣?Google推出DiffusionLight:-新技术估算照片中光照条件。-添加铬球模拟真实反射环境,使添加物体与原光照匹配。?https://x.com/xiaohuggg/status/1744272205658370554?s=20 5️⃣?MATHPILE语料库发布:-29 GB的大规模数学语料库,覆盖K-12至研究生水平。-数据来源包括StackExchange、ProofWiki、arXiv等。-提供详细数据记录和质量注释,可自定义使用。?https://x.com/xiaohuggg/status/1744246627865608573?s=20 6️⃣?XREAL推出AR眼镜XREAL Air 2 Ultra:-配备双3D环境传感器和六自由度功能。-支持高达120Hz刷新率,500尼特亮度。-适用于AR应用开发和空间计算体验。?https://x.com/xiaohuggg/status/1744188783908770222?s=20 7️⃣?Teachable Machine:Google的机器学习

Others are asking
普通人想学习AI自动化,make和coze哪个更推荐一点
对于普通人学习 AI 自动化,Make 和 Coze 哪个更适合的问题,以下是一些相关信息供您参考: Make 对于编程小白比较友好,其思考过程较长,有助于学习,但不太适合专业选手,因为思考过程较慢,可能会让人有点不耐烦。Make 具有国内版优势,包括深度理解中国开发场景和技术生态、完全免费、无需翻墙、流畅稳定,还具备完整的 IDE 功能(代码编写、项目管理、插件管理、源代码管理等)。您可以通过进行尝试。 Coze 是一款 AI Agent 的衍生产品,其价值在于可以跟进当前 AI Agent 工具的发展情况,发现商业化机会,还能用于做产品 Demo。在学习新知识如 RAG 时,可以先通过 Claude 了解细节概念,再通过 Coze 搭建 Demo 进行实践。在学习 RAG 过程中,还可以利用 Coze 的知识库能力创建如产品资料问答机器人等 Bot。 总的来说,如果您是编程小白,Make 可能更适合;如果您希望跟进 AI 工具发展并进行实践操作,Coze 可能更符合您的需求。但最终的选择还需根据您的具体学习目标和个人偏好来决定。
2025-04-08
ai如何让普通人个人实现经济独立
在 AI 时代,普通人实现经济独立可以通过以下方式: 1. 达到人机协作的高级形态与独立创新:努力达到与 AI 高度协同又不失主导的状态,利用 AI 组成自己的“AI 团队”,实现原来需要很多人才能完成的目标。例如在产品开发中,一个人借助 AI 可以同时扮演多个角色,高效完成各项工作,实现一人公司或个人创造者经济。但要达到此阶段,需要对 AI 工具掌控纯熟,保持自主性和判断力,将 AI 看作“增强器”而非替代者。 2. 充分运用 AI 进行渐进式培养:从心态、知识、技能、思维、创造力到协作能力,层层推进,不断强化自身的主动性和思考力,成长为适应 AI 时代的超级个体,在知识广度、思考深度、创造力和效率上实现飞跃。 此外,还可以关注以下方面: 1. 了解 AI 多模态大爆发的趋势,认识到“互动”与“内容”可能变得廉价,而“真实”会成为稀缺资源。 2. 关注“AI 原生”的商业模式,基于 AI 的能力再造商业模式,而非套用现有流程。 3. 思考 AGI 可能带来的极端垄断和中心化操控能力,为自己准备 PlanB。 4. 认识到“人的模型”是 AI Agent 的前提,是 AI 与人合作的关键一环。 5. 关注 AGI 会主动投资的技术,如可控核聚变、量子计算、超导、广义机器人等。
2025-03-24
普通人通过ai赚钱
以下是一些普通人通过 AI 赚钱的方式: 1. 电商:婴儿的四维彩超 AI 预测 思路和玩法:通过 AI 工具将宝宝的四维彩超还原出现实模样进行变现。孕妇妈妈在孕期 22 26 周会进行四维彩超检查,很多准爸爸妈妈期待宝宝的模样,从而衍生出市场需求。在小红书、抖音等公域平台发布相关笔记吸引咨询,将客户引流到私域接单变现。 操作流程:客户提供四维彩超图原图,在 Midjourney 里进行垫图和特定描述词,整个流程不超过 10 分钟就能出图。 变现方式:受众群体多为宝妈,变现方式多样,单价不低。但在平台引流要注意隐蔽,避免被平台检测限流或封号。 2. AI 产业中的机会 基础设施层:布局投入确定性强,但涉及海量资金投入,入行资源门槛高,普通人若无强资源应谨慎入局,可考虑“合作生态”的切入机会。 技术层:技术迭代速度快,小规模团队或个人须慎重考虑技术迭代风险,基础通用大模型非巨无霸公司不建议考虑。 应用层:是广阔蓝海,当前针对行业/细分领域的成熟应用产品不多,“杀手级”应用更是稀少,普通个体和小团队强烈推荐重点布局,拥有超级机会和巨大发展空间。 3. 内容创作 像作者本人是 AI 的受益者,AI 是生产力工具,能降本增效,但仍需投入大量时间和精力,起到辅助作用。 同时存在 AI 的受害者,他们的技能失效,AI 未创造足够新的生存空间。 作者作为坚定的 AGI believer,期望 AI 能做出重大科学发现、治愈疾病、消除饥饿和肥胖、给每人发钱,让人类自由从事想做的事。
2025-03-23
请问普通人怎么从事ai产品经理
普通人要从事 AI 产品经理,可以从以下几个方面入手: 1. 技术背景:具备扎实的编程、算法工程、AI 应用开发、后端开发等技术知识,这对于理解和推动 AI 产品的开发至关重要。 2. 产品开发与管理经验:积累互联网和 AI 产品开发方面的经验,提升项目管理与执行能力,以推动产品的落地与优化。 3. 多元化应用场景:了解 AI 在 AIGC 内容创作、自动驾驶、金融数据分析、教育、医疗健康、影视创作、营销等各行业的应用。 4. 学习与技能提升:处于 AI 技术初学阶段的人,要通过学习提升技能,并将其应用到实际工作和生活中。 5. 工具使用:广泛使用生成式 AI 工具,如 Midjourney、Stable Diffusion(SD)、Coze、GPT 等,培养对工具的熟悉度和运用能力。 6. 协作与共学:积极参与各种 AI 学习社群和线上线下活动,与他人共学交流,提升技能与认知。 7. 内容创作:具备自媒体运营、视频制作、文案策划等内容创作能力。 8. 营销与品牌运营:掌握商业化路径,将 AI 技术与商业化需求结合,提供完整解决方案。 9. 活动策划与执行:积累活动策划和运营经验,具备资源整合和组织协调能力。
2025-03-21
一个高中毕业普通人学习AI如何从小白到精通
对于一个高中毕业的普通人,若想从 AI 小白成长为精通者,可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库中有很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,对于纯小白开发 AI 应用,还可以参考以下经验: 1. 从小白学代码,看人类导师和硅基助教的协作之道: 像案例中,女儿在 Claude 和父亲的帮助下,用 Unity 开发了一个 RPG 小游戏。起初父亲不相信纯小白能通过 AI 搞定 Unity 程序,但女儿通过让 Claude 教她做一个简单任务,半小时内完成并明白了 Unity 里的基本概念。 开发过程有顺利也有挫折,挫折原因包括问题描述不清、AI 给的方案复杂、配置错误等。这让我们意识到小白需要通过 AI 能直接搞定的小项目,先学明白背后的原理,在此基础上才能开发复杂项目。最好有人类导师,一开始把任务拆解到足够小,针对性地设计学习路径,并密切关注随时从坑里捞人。 2. 基础小任务: 推荐从一个最最基础的小任务开始,让 AI 先帮你按照 best practice 写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,学会必备的调试技能。 如果用的是 o1mini,可以在 prompt 最后添加“请生成 create.sh 脚本,运行脚本就能直接创建插件所需要的所有文件。请教我如何运行脚本。”(如果 windows 机器则是 create.cmd),足够勤勉的 o1mini 会为你生成一段超级长的代码,并给出提示,复制粘贴并执行,一次性生成十多个目录和文件,超方便。 3. 明确项目需求: 通过和 AI 的对话,来逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,这样的文档会包含影响技术方案选择的细节,比直接给 AI 一段口头的需求描述要准确得多。在后续开发时每次新起一个聊天就把文档发给 AI 并告知在做第几点功能,会非常方便。
2025-03-21
普通人如何学习AI
普通人学习 AI 可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,还可以参考以下补充内容: 1. 万能公式法:问 AI【一个(xxx 职业)需要具备哪些知识?】,AI 就可给出知识框架,然后根据知识框架每一个小点去问,就能让 AI 工具帮你指数级深度思考。 2. 优质信息源:像没有技术背景的普通人,想要学习或了解 AI,最好的信息源在「即刻」App 的“”等免费圈子里。 3. 信息爆炸之做减法的小 tips: 只掌握最好的产品,少关注新产品测评(除非远超 ChatGPT)。 只解决具体问题,不做泛泛了解。从问题中来,到问题中去。 只关注核心能力,不关注花式玩法,用 AI 扬其长避其短。 只关注理清需求和逻辑,不死记硬背提示词。 先关注提升认知/洞察,然后再谈技巧。 另外,对于纯 AI 小白,如果还在观望 AI 不知从何入手,可以参考《雪梅 May 的 AI 学习日记》。其学习模式是输入→模仿→自发创造。学习内容可去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新内容。学习资源都是免费开源的。
2025-03-21
国内有哪些机器人研发企业
以下是一些国内的机器人研发企业: 宇树科技:从 2013 年开始致力于消费级、行业级高性能通用足式的自主研发,是国内四足机器人相关专利最多的机器人公司。自研电机、减速器、编码器及各类机器人传感器,自主开发各类机器人算法。仅用半年时间就研发出通用人形机器人 H1 并量产,一年内不断迭代更新,综合性能全球领先,跑步速度达到 3.3m/s,创世界纪录,同时也是全球首个可实现原地空翻的全尺寸电驱动人形机器人。其产品丰富多样,包括 Go1、B2、L1、G1、Laikago Pro、A1、Go2 等,并应用于巡检等领域。宇树科技还拥有 180 多项申请国内外专利,150 多项公开授权。此外,宇树科技的产品还曾在冬奥会开幕式、春晚、美国超级碗等重大活动中亮相。
2025-03-20
那普通人要研发机器狗从哪方面开始学习?
对于普通人想要研发机器狗,以下这些 AI 相关的基础知识是很有帮助的: 1. 了解 AI 的概念:AI 即人工智能,是让计算机模拟人类智能的技术。 2. 掌握机器学习:这是电脑找规律学习的方式,包括监督学习、无监督学习和强化学习。 监督学习:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:处理没有标签的数据,让算法自主发现规律,例如聚类任务,像将一堆新闻文章按主题或内容特征分组。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:这是一种参照人脑构建神经网络和神经元的方法,由于有很多层所以称为深度。神经网络可用于监督学习、无监督学习和强化学习。 4. 熟悉生成式 AI:能够生成文本、图片、音频、视频等内容形式。 5. 了解 LLM(大语言模型):对于生成式 AI,生成图像的扩散模型不属于大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解,像上下文理解、情感分析、文本分类等,但不太擅长文本生成。 6. 关注技术里程碑:例如 2017 年 6 月谷歌团队发表的论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。 这些基础知识能为您研发机器狗提供理论支持和技术思路。
2025-02-26
AI对课程研发的
以下是关于 AI 对课程研发的相关内容: 教师的 AI 减负指南生成式人工智能在教学中的应用: 个性化学习计划:分析学生表现并根据知识差距和个人学习风格创建定制的学习路径。 课程开发/学习沉浸:包括生成模型生成图像、文本和视频,转化为补充教育材料、作业和练习题。 社会互动/沟通:与新的 AI 工具(如口语形式的 GPT4o)结合学习,为学生提供更好的准备工具,以应对依赖口语/展示沟通的高等教育和职场环境。 存在的问题:与优秀的人类教师相比仍有差距,如缺乏课时设计,且教学目标设计缺乏合理的梯度。但人机融合是大势所趋,AI 的高效率与人类教师的经验相结合。 相关工具:星火教师助手、知网备课助手。 课程示例: 关于《阿房宫赋》的课程,教学目标包括学生能理解并背诵课文、把握文章大意;了解创作背景,理解作者杜牧对秦朝暴政的批判和对人民疾苦的同情;掌握课文中的重点词汇和句式,提高文言文阅读能力。同时,了解骈文特点,通过诵读理解内容、体会思想感情,了解阿房宫的历史。 针对开发者的 AIGPT 提示工程课程,涵盖软件开发最佳实践的提示、常见用例(总结、推理、转换和扩展),并将使用 LLM 构建一个聊天机器人。 当 AI 走进小学课堂的全套课程设计,先和学生互动,听听他们口中的 AI,再引出概念,用学生能理解的语言激发兴趣、引起好奇心。
2025-02-23
chatgpt公司原研发讲chatgpt的文章网页链接
以下是关于 ChatGPT 公司原研发讲 ChatGPT 的文章网页链接: 1. 育儿相关项目:https://chat.openai.com/share/40f1e3da187a4bef9150f93ca34046f4 ,该项目中使用 ChatGPT 进行了多种操作,如翻译、整理远古动物列表等。 2. AIGC 常见名词解释:https://mp.weixin.qq.com/s/ycDWZ8W46DrsyeNShC1wA ,其中对 ChatGPT 有相关解释。 3. AIGC Weekly01:https://openai.com/blog/chatgpt/ ,介绍了 ChatGPT 的发布情况。
2025-02-13
有用来做网络游戏研发和运营的全套AI工具吗?
目前游戏领域还没有涵盖整个制作过程(包括代码、资产生成、纹理、音频等)的全套生成式人工智能工具,也没有能与流行的游戏引擎(如虚幻和 Unity)紧密结合使用、专为适应典型的游戏生产流程而设计的一体化平台。但有一些相关的工具和平台在不同方面发挥作用,例如: 生成可以互动的角色方面:有很多初创公司在研究,如 Charisma.ai、Convai.com、Inworld.ai 等平台,它们可以为具有情感和自主权的完全渲染的 3D 角色提供动力,并提供工具让创作者给角色设定目标。 语音生成方面:Coqui Studio(https://coqui.ai)、Bark(https://github.com/sunoai/bark)、Replica Studios(https://replicastudios.com)等。 语音识别方面:OpenAI Whisper(https://huggingface.co/openai/whisperbase)、Facebook Wav2Vec2(https://huggingface.co/facebook/wav2vec2largexlsr53)。 对话模型方面:ChatGPT(https://chat.openai.com)、HuggingChat(https://huggingface.co/chat)。 故事讲述模型方面:MPT7BStoryWriter65k+(https://huggingface.co/mosaicml/mpt7bstorywriter)、Claude 100k(https://www.anthropic.com/index/100kcontextwindows)、GTP4 32k(https://platform.openai.com/docs/models/overview)。 游戏设计方面:Ludo.ai(https://ludo.ai)。 搜索引擎方面:Haddock(https://www.haddock.ai)。 AI NPC 方面:Inworld(https://inworld.ai)。
2025-01-23
waytoagi是哪个公司研发的,什么用处
WaytoAGI 是一个由一群热爱 AI 的专家和爱好者共同建设的 AI 开源社区。它的创建者是 AJ,产品经理。 WaytoAGI 具有以下特点和作用: 1. 是一个致力于人工智能学习的中文知识库和社区平台,为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。 2. 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 3. 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 4. 定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 5. 引领并推广开放共享的知识体系,倡导共学共创等形式,孵化了 AI 春晚、离谱村等大型共创项目。 6. 在没有任何推广的情况下,短短一年间,已有超过 100 万用户和超千万次的访问量。 7. 目标是让每个人的学习过程少走弯路,让更多的人因 AI 而强大。 目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱、支付宝、豆包、火山引擎、marscode、coze、堆友、即梦、可灵、MiniMax 海螺 AI、阶跃星辰、百度、Kimi、吐司、liblib、华硕、美团、美的、360、伊利、魔搭、央视频、Civitai、Openart、Tripo3D、青椒云等。打开“waytoagi.com”即可找到社群。
2025-01-20
社群机器人
以下是关于社群机器人的相关内容: 制作 Coze 社群机器人的大致流程看似步骤繁多,但由于 Coze 本身的设计和强大的社区力量,实际操作并不复杂,关键是要“迈出第一步”。在制作过程中,与社区成员设计方案时的深入讨论、在 Coze 平台上灵活组装功能时的高效畅快以及在不断调试优化中见证机器人成长,都充满乐趣。未来会有更多社区加入制作社群机器人的行列,让更多人感受 AI 智能体的魅力,那时的社群机器人不仅是助手,更是凝聚社区集体智慧的伙伴。目前的社区机器人还有不足,作者会继续优化,看其能否更好地服务社区。 如果对学习 Coze 和 AI Agent 有兴趣,可以加入免费的 AI Agent 共学群,该群组会基于 WaytoAGI 社区等高质量信息源分享相关玩法、经验和前沿资讯。可搜索微信号 Andywuwu07 或扫描二维码加微信,备注 AI 共学以便被拉入群。 此外,以综合服务的社群机器人为例,一个好的文章或复杂任务不是一次 AI 工作就能完成的,需要任务拆解,比如对用户问题做意图判断,根据意图将线路转接到正确的专属 AI 机器人那里,整个过程称为工作流,通过搭建工作流来完成复杂任务。
2025-04-15
MacBook 如何做一个 RPA 机器人
以下是在 MacBook 上制作 RPA 机器人的详细步骤: 搭建前准备: 硬件准备: MacBook(需能科学上网) 一部 iPhone 手机 主板 Arduino UNO R4 Wifi(200RMB) 舵机 9g(32RMB) 杜邦线,公对公 7 条(手残党可多备) (可选)八爪鱼支架(10RMB) (二选一)usbtypeC 转接头,或一根两头 typeC 的线 Arduino UNO R4 WIFI 开发板 MG90s/SG90 舵机 9g 云台支架 可选八爪鱼手机支架 杜邦线公对公 搭建步骤: 完成代码: 在 Github 上下载完整代码。 根据需求修改文件: 【必改】在 head.py 中找到填写主板串口的地方,改成串口地址(可通过主板写入的第 3 步里的小字或 Tools>Get Board Info 重新查询,复制 sn 号替换 usbmodem 后面的编码)。 【必改】查询 iPhone 的 ip 地址,填到 talk.py 里(iPhone 设置>无线局域网>点击当前 wifi 旁的感叹号>找到 ipv4 地址里写的 ip 地址)。 【必改】把 open ai key 填到 talk.py 里。 【可选】在 talk.py 里,可以修改: Openai 调用的 model。 system prompt(机器人的人设)。 机器人的音色。 录音的设置。 【可选】在 head.py 里,可以修改不对话后,等待多久恢复人脸追踪。 运行程序: 在 MacBook 上按下 command+space(空格)打开一个新的终端,依次输入如下代码(每一次代码运行完以后再输入下一个),全部完成后,关闭端口。 将 iPhone 的屏幕关闭时间设置为 5 分钟或永不。 打开 iPhone 的 pythonista 并复制 face.py 的代码进去,运行。注意:每一次如果需要重新运行 pythonista,请先杀后台再运行,否则会因为端口已经被占用而无法播放声音。 找到下载下来的 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”。 将 arduino R4 与 MacBook 相连,在终端中输入以下代码,运行后程序会申请一次摄像头权限,点击允许,然后出现运行失败,再运行一次即可。这个程序一旦运行,无法自然退出,建议直接拔掉 R4 的线或者终端输入 control+c 或者直接关闭终端,但多强制退出几次以后运行就会卡住需要重启或清进程。 再次在 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”,在终端中输入以下代码,运行后程序会申请一次录音权限,点击允许,然后出现运行失败,再运行一次即可。如果运行中出现任何报错,将本文档,代码,报错信息给到 GPT4,让他帮助你就好~可能是有一些库没有预装。 把 talk.py 的终端放在最前面你能看到,出现 recording...的时候就可以说话了。 三个程序同时运行、iPhone 和 MacBook 在同一 wifi,iPhone 没有调静音的情况下,就可以正常对话啦。
2025-04-11
怎么搭建微信机器人?
以下是搭建微信机器人的步骤: 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。 2. 如果想为这个 AI 赋予提示词,可以返回相应步骤进行更改。例如在“目录 4 里的第 17 步”或“第三章,第 7 步”,其中双引号内的 value 部分,便是设置 AI 提示词的地方。 3. 此后,进行任何更改,都需要重新打印登陆二维码。并且一个月内,不要上来就加好友、最好不要私聊聊天。 4. 报错"wxsid"是因为微信未实名,实名即可解决。 5. 如果没有手机登录,可以使用夜神模拟器模拟手机登录。 6. 重新在“文件”的【终端】里,直接输入 nohup python3 app.py&tail f nohup.out 重新扫码登录。 7. 多次重新登录后,就在宝塔“首页右上角点击重启,重启一下服务器”,清理进程。 8. 熟悉 linux 操作的话,也可以通过重启进程的方式来重启服务。 9. 如果想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 此外: 1. Link AI 提供的 100 个,合计 3500 万 GPT3.5 Token 的礼品码。可以用来实现画图、搜索、识图等功能,COW 插件里几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里,领兑换码。 2. 添加微信,拉您进机器人群,先行体验。 如果您仍旧遇到问题,可以先查询社区知识库,或者加“通往 AGI 之路”群,社区小伙伴们会尽力帮助。也可以加 Stuart 个人微信询问。
2025-04-11
创建飞书ai机器人
创建飞书 AI 机器人的步骤如下: 1. 工作流搭建: 打开 Comfyui 界面后,右键点击界面,即可找到 Comfyui LLM party 的目录,您既可以学习如何手动连接这些节点,从而实现一个最简单的 AI 女友工作流,也可以直接将工作流文件拖拽到 Comfyui 界面中一键复刻。 2. 飞书机器人创建: 飞书应用建立: 在中创建自建应用。 进入应用获取 app_id 与 app_secret。 添加应用能力>开启机器人应用能力。 权限管理>消息与群组>选择需要的权限打开。 安全设置>将 comfyUI 运行的电脑 IP 加入白名单。 发布机器人以应用生效。 获取群组或用户 id: 要先把创建的机器人拉到群组中或者拉进私聊。 飞书开发平台找到发送消息的开发文档。 右侧点击获取 token。 选择 receive id type,chat_id 对应群组,open_id 与 user_id 对应个人,点击选择成员,复制对应的 id 即可。 如果需要让机器人发送语音,需要自行在电脑上安装 ffmpeg 。
2025-04-11
微信机器人如何配置
微信机器人的配置步骤如下: 1. sum4all 配置 进入插件目录:/root/chatgptonwechat/plugins 找到 sum4all 插件目录下的 config.json.template,复制并粘贴重命名为:config.json 注册并获取 sum4all key:https://pro.sum4all.site/register?aff=T6rP ,新用户注册有送免费额度,大家先使用这个进行试用,后续可改为自己的 openAI key。 把复制的 key,粘贴到 sum4all 的 config.json 文件内。(上方有功能阐述,你想要哪个,就把哪个改成 ture) 2. Apilot 配置 进入插件目录:/root/chatgptonwechat/plugins 找到 Apilot 文件下的 config.json.template,复制并粘贴重命名为:config.json 去 https://admin.alapi.cn/account/center 注册,并复制 key 把复制来的 key,粘贴进入。保存。 3. 分段对话配置替换 找到这个路径:/root/chatgptonwechat/channel/wechat,直接下载以下文件进行替换。 此外,微信的配置相对较简单,只需要主项目的 config.json 文件看看是否有"channel_type"参数,参数值为:"wx",即:"channel_type":"wx"。完成以上所有配置部分后,可以准备启动步骤了: 使用 nohup 命令在后台运行程序。 执行完启动脚本,等待 30s 左右,会看到终端有一个微信登录的二维码,微信扫码登录。 如果您想使用更多辅助功能,比如使用总结文件能力,总结网页内容能力,此时需要安装各种插件。这部分配置查看插件配置管理部分。
2025-04-10
利用飞书多维表格,做一个类似于客服机器人 可以怎么做?
利用飞书多维表格做一个类似于客服机器人,可以按照以下步骤进行: 1. 创建一个拟人化的 bot,比如起名叫青青,设定其为人设是一个可爱有趣的少女,擅长回答各种刁钻的问题。完成 BOT 捏好后点击发布。 2. 发布时配置飞书多维表格: 输出为文本时,第一步配置为文本。 配置多维表格输入表单,选择用控件的字段选择器,给字段标题随便起个名字如“question”。 在完善捷径的商家信息这里,可以选择全量发布,也可以选择仅自己可用。为了审核快一些,可以选择仅自己可用。等审核通过之后,就可以在飞书多维表格里面看到发布成功。 3. 还可以探索字段捷径的各种玩法(不含 bot),比如直接创建一个多维表格,第一列是几个成语,第二列是 AI 字段捷径生成的对成语的解释。左边输入一列,比如一列成语,右边配置 AI 字段。 此外,还有一些相关信息供您参考: “Show Me 扣子 AI 挑战赛大消费行业专场圆满落幕,探索 AI 与大消费行业的深度结合”中提到了一些相关作品,如帮助企业快速建立产品智能客服体系、ERP 高智版:扣子销售订单管理大师、亚马逊商品评论智析、AI 电商设计师等。 2024 年历史更新(归档)中包含了关于飞书多维表格字段捷径配置 COZE 的 BOT 青青的相关内容。
2025-04-08
如果制作智能体
制作智能体的方法如下: Logo 设计智能体: 江树提供了提示词模板,使用方法为将品牌、行业、理念等信息替换成自己的,复制到 GPT4o 中,即可瞬间呈现高质量 Logo。 若想进一步提升设计效果,可使用江树设计的 Logo 智能体生成更精准的提示词,访问链接 https://chatgpt.com/g/g67f4bf538f9081918073af13ba5c2cfelogodesigner ,生成的提示词可直接复制到 GPT4o 中,并借助最新的 AI 绘图能力达到专业设计水准。 Coze 智能体(字段捷径)获取笔记+评论信息: 第一步,创建一个智能体,使用单 Agent 对话流模式。 第二步,编排对话流,点击创建新的对话流(记得要和智能体关联)。 第三步,在获取笔记详情节点和笔记评论节点分别配置 cookie,note_link 使用开始节点的 USER_INPUT。 第四步,使用代码节点进行数据处理,注意代码节点输出的配置格式。 第五步,测试。找到一篇小红书笔记,试运行对话流,直接在对话窗口输入地址,看到数据即为成功。回到智能体的编排页面,同样方式测试,确保对话流执行成功。 第六步,发布。点发布后只选择多维表格,然后点配置。输出类型选文本,输入类型选择字段选择器。完善上架信息,填个表格,选发布范围时可选仅自己可用以加快审核。提交上架信息后,返回配置界面显示已完成即可完成最终提交。 其他智能体: 如创建一个输入人设等信息的智能体,放上已创建的工作流。但注意工作流中若有消耗个人资源的部分,如【所有视频片段拼接】节点使用的插件 api_token 填的是个人 token,不能直接发布。可将 api_token 作为工作流最开始的输入,用户购买后输入 api_token 再发布。
2025-04-14
最好的制作ppt的大模型是哪个
目前在制作 PPT 方面,没有绝对的“最好”的大模型。例如,Claude 3.7 在将 PDF 转换为 HTML 方面效果较好,但国内用户使用不太方便,可改用 DeepSeekR1 实现。某上市公司使用某互联网大厂研发的千亿 AI 大模型产品声称能 3 分钟制作 PPT,但接入公司系统时出现“一连接就死机”的情况。同时需要注意的是,过去几个月内国内的 AI 大模型在某些方面大同小异,且大部分远未达到可商用化程度。
2025-04-13
AI 制作短视频的方法
以下是关于 AI 制作短视频的方法: 1. 确定视频风格和主题:使用 Fanbook 中的 niji6 模型及sref 指令,加上每张图片的提示词来确定视频风格的一致性。比如根据丝绸之路的古风主题确定风格和时长,然后设定故事主线和镜头。 2. 创作故事剧本和分镜头:参考分镜头的基本格式要求,按照场景、地点、镜号、画面描述、台词、音效等维度进行填充。尽可能精简人物对话,提炼重点。当缺乏画面灵感时,可以借助语言大模型,如 Kimi 来获取帮助。 3. 生成角色和场景:根据剧本中的人物性格特征和时代背景,描绘人物的提示词、上传角色参考图cref,并将角色背景扣除以便于进行角色加背景的融合生成时进行垫图操作。场景提示词从剧本中的画面描述进行提取,采用文生图模式,画面风格选择提前准备好的风格图进行垫图,上传角色图、场景背景进行参考生成,提高人物和场景的融合度。 4. 让图片动起来:使用即梦进行图生视频,上传图片至视频生成模块,用简单提示词描绘画面中的动态内容,可生成时长为 3 秒钟的画面。运镜类型可根据剧本中的镜头描绘设置,主要设置以随机运镜为主,生成速度根据视频节奏选择。 此外,根据视频脚本生成短视频的 AI 工具有多种,适用于不同的应用场景和需求,包括: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户提供文本描述来生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-13
我想通过AI制作H5页面
以下是关于通过 AI 制作 H5 页面的相关信息: AI+高德 MCP 可以帮助您制作 H5 页面。目前,该工具已经有 1000 多人进行制作,还有几十位同学已经发出了自己的产品。 这次更新带来了三个超级实用的功能: 1. 24 种超酷的 H5 风格可供选择,如同选衣服一样简单。 2. 具备一键导航功能,无需复制粘贴地址。 3. 数据更真实,不用担心 AI 瞎编。 使用这些功能,10 分钟就能全部搞定。 在上期文章《》中,详细讲解了获取高德地图的密钥、cursor 如何设置 MCP、询问高德 MCP 生成旅游信息以及美化页面展示等内容。如果您还未阅读,可以点击查看。 另外,使用 Cursor 制作主页的步骤如下: 在搞定一个简单小游戏后,可以做个人介绍网站。假设要做一个《全 AI 自动驾驶的火星登陆飞船》项目,首先要有初步的项目介绍,然后新建一个相关文件夹并打开,在 AI 对话框中输入介绍内容,等待 AI 制作并加入修改意见。 若想让别人看到您的作品预览,可以通过网站 https://www.yourware.so/ 将项目文件夹整体上传,生成临时浏览链接,在不需要域名和服务器的情况下让外部看到作品。如果发现 cursor 卡顿,注意是否需要在终端区或者对话区确认重要操作,可将左下角的 ask every time 修改为 auto run 实现全自动化。
2025-04-13
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
如何使用AI制作真人表情包?
以下是使用 AI 制作真人表情包的方法: 1. 使用 Gemini 2.0 Flash: 场景:表情包在社交媒体中是不可或缺的表达工具,但制作个性化表情包对许多人来说并不容易,有的工具可以生成根据某一个主体生成不同的表情,但是生成出来的图会多多少少改变原主体。 实用性:用户只需上传一张主体图片(例如一个小女孩的照片),通过简单的自然语言指令(如“让她开心大笑”),Gemini 就会自动生成相应的表情图片。 指令:“生成 XXX + XXX 的表情” 2. 使用 ChatGPT 4o: 输入提示词并加上最初的真人图片,例如:创建图片:一个戴着深蓝色蝴蝶结领结的柴犬,表情参考我上传的图片,3D 风格,毛绒绒质感,不要太逼真,比例为 1:1。如果对生成的第一个表情不满意,可以重新输入指令进行调整,如“让它看起来得意一点”。 一次生成九宫格表情包的方法:先收集很多自己喜欢的表情包,将每组拼图为 9 个,然后将先前做好的真人原图和一张九宫格拼图一起上传到 4o 对话框,输入相应指令,如:创建图片:参考图二的动作和道具制作表情包九宫格,每个图案都替换为图一为主角,保持风格为图一的质感,整整齐齐无留白排列,颜色明亮不偏黄,文字内容仔细核对不要出错。 另外,有的地方需要上传封面图,也可以由 4o 生成,先要求它做一个比例约 3:2 的。如果有个很喜欢的表情,使用九宫格出的效果不好,也可以单个一个个去生成,但比较费时间,且可能会受出图限制等待更久。最后将所有图片下载下来,挑选出需要的表情图片。
2025-04-11