Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

空间智能

Answer

空间智能是让 AI 理解现实世界的关键,其赋予了 AI 了解真实世界的能力。李飞飞在演讲中将生物的视觉能力与寒武纪大爆发进行类比,指出数字寒武纪大爆发需通过空间智能实现。北京星动纪元公司发布的机器人手 Xhand 拥有 12 个主动自由度,内置触觉传感器,能高度控制精度,温柔抚摸猫咪、精确操作剪刀、拿捏鸡蛋等。ChatGPT 改进数据分析功能,新增交互式表格和图表功能,支持从 Google Drive 和 Microsoft OneDrive 添加文件,能定制和交互多种图表类型。Stability AI 面临资金紧张,正在寻求出售,已与潜在买家进行谈判。腾讯混元是中国首个开源的 AI 绘图大模型,采用 DiT 架构,支持中文原生,可免费使用。其提供在线平台和模型下载,效果不错,支持多轮对话生成。

Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?Xiaohu.AI日报「5月17日」 ✨✨✨✨✨✨✨✨1⃣️?北京星动纪元公司发布了一个机器人手:Xhand-拥有12个主动自由度,内置触觉传感器-能高度控制精度,温柔抚摸猫咪、精确操作剪刀、拿捏鸡蛋等-视频显示其灵活性? https://x.com/imxiaohu/status/17913700343524353342⃣️?李飞飞TED演讲-介绍空间智能,赋予AI了解真实世界的能力-类比生物的视觉能力与寒武纪大爆发-数字寒武纪大爆发需通过空间智能实现?原版视频:https://ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world?文字版翻译:https://xiaohu.ai/p/81053⃣️?ChatGPT改进数据分析功能-新增交互式表格和图表功能-支持从Google Drive和Microsoft OneDrive添加文件-能定制和交互多种图表类型?详细:https://xiaohu.ai/p/80284⃣️?据The Information报道- Stability AI面临资金紧张,正在寻求出售-已与潜在买家进行谈判

XiaoHu.AI日报

?Xiaohu.AI日报「5月17日」 ✨✨✨✨✨✨✨✨1⃣️?北京星动纪元公司发布了一个机器人手:Xhand-拥有12个主动自由度,内置触觉传感器-能高度控制精度,温柔抚摸猫咪、精确操作剪刀、拿捏鸡蛋等-视频显示其灵活性? https://x.com/imxiaohu/status/17913700343524353342⃣️?李飞飞TED演讲-介绍空间智能,赋予AI了解真实世界的能力-类比生物的视觉能力与寒武纪大爆发-数字寒武纪大爆发需通过空间智能实现?原版视频:https://ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world?文字版翻译:https://xiaohu.ai/p/81053⃣️?ChatGPT改进数据分析功能-新增交互式表格和图表功能-支持从Google Drive和Microsoft OneDrive添加文件-能定制和交互多种图表类型?详细:https://xiaohu.ai/p/80284⃣️?据The Information报道- Stability AI面临资金紧张,正在寻求出售-已与潜在买家进行谈判

4.6 历史更新

《[李飞飞揭秘创业方向“空间智能”:视觉化为洞察,看见成为理解,理解导致行动](https://mp.weixin.qq.com/s/0tNw4osUmVg0eHzfkijE-Q)》来自量子位,李飞飞揭秘创业方向“空间智能”,强调视觉化为洞察;看见成为理解;理解导致行动。她讲述了生物视觉的进化和计算机视觉的崛起,指出空间智能是让AI理解现实世界的关键。通过教计算机看到、学习、行动,以及转化照片为3D空间等技术,未来AI有望实现更多复杂任务,如探索数字世界和与3D世界互动。《[我们也终于有了自己的开源AI绘图大模型,它叫,腾讯混元](https://mp.weixin.qq.com/s/XYMSREg_zQ8lO4ipYYxAMg)》卡兹克的新文章,腾讯混元是中国首个开源的AI绘图大模型,采用DiT架构,支持中文原生,可免费使用。其提供在线平台和模型下载,效果不错,支持多轮对话生成。

Others are asking
coze搭建智能体,用上传的文件和知识库的文件做对比,分析差异点。
以下是关于在 Coze 中搭建智能体的相关信息: 1. 证件照相关操作: 展示原图上传结果,基本脸型已换,生成效果与上传照片特征有关。 改背景可利用改图功能,一键改图效果更好,输出数据类型为图片。 豆包节点生成的是 URL 地址,与前者不同,在工作流使用有差异,可参考简单提示词。 介绍证件照工作流相关操作,包括通过提示词改背景颜色,设置输出方式为返回变量;讲解消耗 token 及保存结果相关问题;对按钮、表单添加事件并设置参数,限制上传文件数量;还涉及给表单和图片绑定数据,以及每次操作后刷新界面确保设置生效。 围绕操作讲解与优化展开,介绍 for meet 的设置,如表单事件操作、图片上传数量修改等,提及编程基础知识。还讲述成果图连接、绑定数据方法及注意事项。展示基本功能实现情况,分析换性别等问题成因,指出需在工作流优化提示词,也可尝试用视频模型解决,最后进入问答环节。 2. 多维表格的高速数据分析: 创建智能体,使用单 Agent 对话流模式。 编排对话流,创建新的对话流并关联智能体。 使用代码节点对两个插件获取的结果进行数据处理,注意代码节点输出的配置格式。 测试,找到一篇小红书笔记,试运行对话流,在对话窗口输入地址查看数据。 发布,选择多维表格,配置输出类型为文本,输入类型选择字段选择器,完善上架信息,可选择仅自己可用以加快审核。 3. 智能体与微信和微信群的连接: 创建知识库,可选择手动清洗数据提高准确性,包括在线知识库和本地文档。 在线知识库创建时,飞书在线文档中每个问题和答案以分割,可编辑修改和删除。 本地文档中注意拆分内容提高训练数据准确度,如将课程章节按固定方式人工标注和处理。 发布应用,确保在 Bot 商店中能够搜到。
2025-04-18
想要做一节讲如何用智能体做企业数字化转型的课程,如何设计
以下是关于如何设计用智能体做企业数字化转型课程的建议: 一、参考案例 1. 李国宝的相关经验 具有丰富的从业经验,包括通信工程、数据通信网络培训、创业、网络安全解决方案及培训、AI 课程开发与培训等。 开发过面向不同群体的 AI 课程,如《数字化转型实践》面向传统企业数字化、AI 赋能转型。 2. 90 分钟从 0 开始打造你的第一个 Coze 应用课程 从零开始教学做应用界面,先基础教学,再涉及特定应用。 介绍当前承接业务,包括辅导、培训、定制及企业 AI 落地等。 挖掘用户对 AI 应用的功能需求,如对交互界面的需求。 二、课程设计要点 1. 对于企业管理者 AI 辅助决策:在小规模决策中使用 AI 分析工具,以其分析结果作为决策参考。 员工培训计划:制定 AI 工具使用的培训计划,帮助团队成员了解日常工作中如何有效利用 AI。 流程优化:识别公司中可能受益于 AI 自动化的重复性任务,从小流程开始测试 AI 解决方案的效果。 AI 伦理和政策:制定公司的 AI 使用政策,确保 AI 应用符合伦理标准和法律要求。 2. 对于教育工作者 AI 辅助教案设计:尝试使用 AI 帮助设计课程大纲或生成教学材料 ideas,为课程带来新视角。 个性化学习路径:探索使用 AI 分析学生学习数据,为不同学生制定个性化学习计划。 创新教学方法:考虑将 AI 工具整合到课堂活动中,如使用 AI 生成的案例研究或模拟场景。 AI 素养教育:开发简单的课程模块,教导学生了解 AI 基础知识、应用领域及其对社会的影响。 三、注意事项 无论面向哪个群体,都应记住:与 AI 协作是一个学习过程。从小处着手,保持好奇心和开放态度,会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。最重要的是,始终保持批判性思维,将 AI 视为强大的工具,而不是完全依赖的解决方案。
2025-04-18
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
AI Agents(智能体)
AI 智能体(Agents)是人工智能领域中一个重要的概念: 1. 从 AGI 的发展等级来看,智能体不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 2. 作为大模型的主要发展方向之一,智能体中间的“智能体”其实就是大模型(LLM)。通过为 LLM 增加工具、记忆、行动、规划这四个能力来实现。目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。 3. 从智能体的起源探究来看,心灵社会理论认为智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,每个层次由多个 Agent 负责,每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。同时存在专家 Agent、管理 Agent、学习 Agent 等不同类型的 Agent 及其相应功能。从达特茅斯会议开始讨论人工智能,到马文·明斯基引入“Agent”概念,“AI”和“Agent”就彻底聚齐,往后被称之为 AI Agent。
2025-04-15
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
什么是通用人工智能
通用人工智能(AGI)是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。 目前 AGI 还只是一个理论概念,没有任何 AI 系统能达到这种通用智能水平。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力的 AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平的 AI,能够解决复杂问题,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务的 AI。目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明的 AI,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 常见名词解释: AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。
2025-04-15
知识空间
以下是关于知识空间的相关介绍: LangGPT 提示词知识空间: 这里汇集了高质量的提示词工程技术、教程和工具相关内容。 内容来源于 LangGPT 提示词社群,社群内汇聚了大批提示词爱好者,群内讨论气氛热烈,交流质量高,在主要大城市建立了提示词交流小分队。 具有开源、开放、共享、共建的特点: 开源:知识空间内的文档阅读、复制无限制,但请勿搬运。 开放:欢迎加入“LangGPT 社群”分享交流 Prompt 工程技术。 共享:群里的优质资源和知识会吸收进知识空间开放共享。 共建:欢迎投稿优质内容,成为共建者(私信江树,微信:zephyr_ai)。 权益声明:开源不代表可以随意搬运,未经授权禁止搬运内容。 知识库文章索引包括: 《通往 AGI 之路》知识空间: 旨在提供全面系统、易于理解的 AI 学习路径,帮助了解 AI 从概念到应用等各方面知识,引发思考“我可以用 AI 做什么,帮助自己更强大”。 相关链接: 直播回放:https://www.bilibili.com/video/BV1QN411j719/ 欢迎订阅 X(Twitter):https://twitter.com/WaytoAGI 最新知识库精选同步:(小红书)
2025-04-10
WaytoAGI coze 共享空间
WaytoAGI 是一个致力于人工智能(AI)学习的中文知识库和社区平台。 社区介绍: 汇集上千个人工智能网站和工具,提供最新的 AI 工具、应用、智能体和行业资讯。 提供丰富学习资源,包括文章、教程、工具推荐及行业资讯等。 定期组织实践活动,如视频挑战赛、模型创作大赛等。 引领并推广开放共享的知识体系,倡导共学共创,孵化了 AI 春晚、离谱村等大型共创项目。 在没有任何推广的情况下,一年时间已有超过 100 万用户和超千万次的访问量。 目标是让每个人的学习过程少走弯路,让更多的人因 AI 而强大。 目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱、支付宝、豆包、火山引擎、marscode、coze 等。 从基础案例入门: 三分钟捏 Bot: 登录控制台:登录扣子控制台(coze.cn),使用手机号或抖音注册/登录。 在我的空间创建 Agent:在扣子主页左上角点击“创建 Bot”,选择空间名称为“个人空间”、Bot 名称为“第一个 Bot”并确认。如需使用其他空间,先创建后选择;Bot 名称可自定义。 编写 Prompt:填写 Prompt,即想要创建的 Bot 功能说明,第一次可用简短词语作为提示词。 优化 Prompt:点击“优化”进行优化。 设置开场白及其他环节。 发布到多平台&使用。 进阶之路: 15 分钟:查看其他 Bot 获取灵感。 1 小时:找到和自己兴趣、工作方向等结合的 Bot 深入沟通,阅读相关文章。 一周:了解基础组件,寻找不错的扣子借鉴复制,加入 Agent 共学小组,尝试在群里问第一个问题。 一个月:合理安排时间,参与 WaytoAGI Agent 共学计划,自己创建 Agent 并分享经历心得。 在 WaytoAGI 的支持:包括文档资源、交流群、活动。 此外,大圣提供了胎教级教程:万字长文带你使用 Coze 打造企业级知识库,相关活动及链接如下: coze 官方活动正在进行中奖金丰厚: 参赛作品提交页:https://bytedance.larkoffice.com/share/base/form/shrcnH7yDl3oqOiQeQ2LTFnByXe 渠道选择 WaytoAGI,提交后记录到。 扣子专业版注册链接:https://zjsms.com/iAfQNK4U/ 参考模板:https://www.coze.cn/template 线下路演报名:https://bytedance.larkoffice.com/share/base/form/shrcnhJdt1EZXicuO23kVzeOved 大圣的个人宝藏:
2025-03-25
WaytoAGI共享空间
WaytoAGI(通往 AGI 之路)是一个致力于人工智能学习的中文知识库和社区平台,其创建者为产品经理 AJ。项目起源于创建者希望通过收录整理信息、促进交流来补齐信息差,更好地学习。 社区特点包括: 1. 拥有丰富的资源:汇集了上千个人工智能网站和工具,提供最新的 AI 工具、应用、智能体和行业资讯,还有超千万次的访问量和 150 万以上的社区成员。 2. 提供多样学习资源:涵盖文章、教程、工具推荐及最新行业资讯等。 3. 组织实践活动:如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习和交流合作。 4. 倡导开放共享:引领并推广开放共享的知识体系,孵化了 AI 春晚、离谱村等大型共创项目。 5. 拥有庞大用户基础:在未推广情况下,一年时间已有超 100 万用户和超千万次访问量。 6. 明确目标愿景:让每个人的学习过程少走弯路,让更多的人因 AI 而强大。 目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱、支付宝、豆包、火山引擎、marscode、coze、堆友、即梦、可灵、MiniMax 海螺 AI、阶跃星辰、百度、Kimi、吐司、liblib、华硕、美团、美的、360、伊利、魔搭、央视频、Civitai、Openart、Tripo3D、青椒云等。 近期活动有: 1. 【WaytoAGI 实验室】。雅典学院由中科院大学天蛛团队、WaytoAGI、天津美院、中央美院科技艺术研究院,牛津大学,CAMELAI 社区等共同组织发起,是一个融合科学与艺术的虚拟数字雅集。 2. ,初赛阶段为 2024/12/3 2025/2/10。 此外,JK 分享了使用 Suno 的经验,已生成 1000+音乐,并介绍了 Suno 基础功能使用教程,包括创建歌曲时的注意事项等,还分享了自己创作的歌曲链接。
2025-03-25
生成设计图:包括图书馆静音舱+小组讨论舱 :用隔音板材划分独立空间,舱体外壳由学生绘制抽象艺术图案。 可变形桌椅 :定制模块化桌椅,支持拼合为“创作大桌”或独立卡座,适配小组作业与个人学习。 艺术疗愈角 :设置减压涂鸦墙、小型绿植温室,配备舒缓音乐耳机。
以下是为您提供的关于生成您所需设计图的相关信息: 星流一站式 AI 设计工具具有入门模式和高级模式。 入门模式: 可以使用图像控制功能精准控制生成图像的内容和风格,如空间关系、线稿、人物长相、姿势等。 只能使用以下四种参考功能: 全部图片参考功能,包括原图、景深、线稿轮廓、姿势、Lineart 线稿、Scribble 线稿、光影、Segmant 构图分割等。 原图、SoftEdge 线稿、配色参考、配色打乱、法线贴图、MLSD 线稿等。 高级模式: 点击生成器下方的切换按钮进行切换。 与入门模式相比增加了高级模式框架。 基础模型方面,允许使用更多的微调大模型,如基础模型 F.1、基础模型 XL、基础模型 1.5。 图片参考方面,允许使用更多的图像控制功能,在星流基础大模型下,增加了 tile 分块与 softedge 线稿。 高清分辨率修复:利用算法对初步生成的图像进行简单的图生图高清放大(目前仅支持基础模型 xl 和 1.5 模型)。 放大算法会影响图像放大后的图像质量,建议默认即可。 重绘幅度与初步生成的图像的相似度有关。 其他参数默认即可,参数方面允许调整更多的高级参数。 采样器方面,采样方法决定了模型在生成图像过程中的出图质量,有些采样器在细节处理上表现更佳比如 DPM++2M,而有些则在生成速度上更快,比如 Euler。 采样步数一般来说,步数越多,模型对图像的生成和优化越充分,但同时也会增加生成时间。 随机种子是文生图的随机数种子,通过设置相同的随机数种子,可以确保在相同的参数配置下生成相同的图像。 CFG Scale 控制生成图像与提示词一致性的重要参数。 具有脸部/手部修复功能,利用算法对人像的脸部或者手部进行修复。 此外,学生使用项目化的方式分析现状,做问卷调查,数据分析,在 ChatGPT 的帮助下设计出优化过的设计图,然后使用 3D 的空间设计软件设计出来 3D 的设计图。比如有孩子为优化老师家访路线提出做一个软件产品的案例。
2025-03-23
Stable Diffusion 是 Diffusion Model 的优化版本,引入了潜在空间(Latent Space)技术,这个潜在空间(Latent Space)是什么意思,它的实现原理是什么?
在 Stable Diffusion 模型中,潜在空间(Latent Space)指的是图像的潜在分布,它包含了与图像相关的所有信息。 图像被映射到潜在空间后,扩散过程在这个空间中进行。ComfyUI 中的许多操作都在潜在空间中进行,如 KSampler 节点就是在这个空间中执行采样过程。在潜在空间中,通过节点调整对潜在空间的操作,如噪声添加、去噪步数等,这部分通常由潜在空间操作模块来实现。 在 Stable Diffusion 模型中,图像的潜在分布是通过一个编码器解码器结构来学习的。编码器将图像映射到潜在空间,而解码器则将潜在空间中的向量映射回图像空间。通过这种方式,模型可以学习到图像的潜在分布,从而实现图像生成、编辑和操作。 在采样过程中,Stable Diffusion 模型通过逐步降低噪声水平来生成图像。在这个过程中,模型根据当前的噪声水平预测图像的潜在分布,然后根据这个分布生成一个新的图像。这个过程重复进行,直到生成一个高质量的图像。 与之对应的是像素空间(Pixel Space),像素空间指的是图像中每个像素的原始颜色或强度值所组成的空间。图像可以看作是一个二维或三维的矩阵,其中每个元素代表一个像素。在像素空间中,图像的表示是密集的,且包含了大量的细节信息。
2025-03-21
coze如何复制别人的工作流到自己个人空间
要在 Coze 上复制别人的工作流到自己个人空间,您可以按照以下步骤进行操作: 1. 在 Coze 上新建一个工作流,逐步导入别人项目的核心流程。整个工作流分为若干个节点,每个节点完成一个特定的任务。 2. 工作流被分为了初始翻译、反思优化、结果输出等几个主要部分,每一部分都对应了若干个节点。 3. 首先是开始节点,在这里需要选择翻译的源语言和目标语言,还可以设置一些其他参数,如翻译的语言特色等,此参数会影响翻译效果和效率,建议根据实际情况调整。 4. 接下来是初步的翻译大模型节点,选择一个大模型对源语言文本进行初始翻译。 5. 进入 Coze,点击「个人空间 工作流 创建工作流」,打开创建工作流的弹窗。 6. 根据弹窗要求,自定义工作流信息,点击确认后完成工作流的新建。 7. 左侧「选择节点」模块中,根据子任务需要,实际用上的有插件(提供一系列能力工具,拓展 Agent 的能力边界)、大模型(调用 LLM,实现各项文本内容的生成)、代码(支持编写简单的 Python、JS 脚本,对数据进行处理)。 8. 编辑面板中的开始节点、结束节点,分别对应分解子任务流程图中的原文输入和结果输出环节。接下来,按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,即可完成工作流框架的搭建。
2025-03-04