Chat with Wiki - 端到端模型的应用场景

Answer

端到端模型的应用场景包括以下方面：

硬件领域，如机器人、耳机等。
处理垃圾情绪。
音视频应用，效果良好。
手机侧，作为原生 AI OS 的未来重点方向，有望成为新的交互入口，除生成内容外，还能调用手机上的各类应用程序，方便用户完成各类操作。
自动驾驶，输入为视觉，输出为油门、刹车、方向盘等。
物体分拣，输入包括视觉、指令、数值传感器，输出为抓取目标物体并放置到目标位置。

Content generated by AI large model, please carefully verify (powered by aily)

References

[heading2]总结AI应用与技术分享预告明日应用讲解安排：许键明日9点半讲解应用创建，AJ明日8点开始讲端到端语音模型，之后许键介绍cos搭建及赚钱方式。端到端语音模型介绍：智普的端到端语音模型开源，可云端使用，能理解情感，有想象空间，明日或有100个内测名额。模型应用场景探讨：可应用于硬件如机器人、耳机等，能处理垃圾情绪，音视频应用效果好。相关资源获取途径：搭建智浦agent回拨将上传b站，多维表格在vtoagi.com知识库首页。飞书会议参与方式：飞书会议号185655937，在飞书输入号码即可加入。

具身智能赛道爆发的前夕，我们应该了解些什么？（上）｜Z研究第 5 期

总结总结1：为何是RFM-1和Optimus研发出了端到端的大模型？场景优势：数据丰沛：Tesla具备大量的自动驾驶数据，其电动汽车销量在全球断崖式领先；Covariant AI的物流分拣机器人运行多年，其传感器收集了大量数据。数据结构化：RFM-1应用场景为仓储业务中的物体分拣；而FSD系统用于自动驾驶。这两项机器人任务的输入和输出都相对结构化。RFM-1和Optimus这类世界模型与VLA（Vision-language-action）大模型存在很大的不同，VLA大模型是先在互联网规模的大数据集上训练使其达到high-level能力涌现，再跟真实世界机器人数据做co-finetune，而世界模型是在物理世界数据上从头训练，随着数据量的增大逐渐涌现出某种高层次的能力。但它仍然是低层次物理世界模型，有点类似人类神经反射系统的机理，比较适合输入输出都相对结构化的场景，如自动驾驶（输入：视觉，输出：油门、刹车、方向盘）、物体分拣（输入：视觉、指令、数值传感器，输出：抓取目标物体，放置到目标位置），不太适合泛化到非结构化的复杂任务。总结2：响应速率和搭载VLM高度相关

10月盘点：AI 行业大事记

在手机侧，原生AI OS是未来的重点方向，有望成为新的交互入口。也就是说，端侧模型除了生成内容，还可以调用手机上的各类应用程序，让用户更方便地完成各类操作。端侧模型指在终端设备上运行的大型预训练模型。如果你想了解更多相关知识，推荐面壁智能CEO@李大海的几次访谈，内容都非常不错↓↓↓[with脉脉创始人林凡](https://mp.weixin.qq.com/s?__biz=MzIwMTY1NDg4Nw==&mid=2247520957&idx=1&sn=46838f2ffee9b8c96167fe392df2e728&scene=21#wechat_redirect)[with极客公园创始人张鹏](https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653045400&idx=1&sn=fe9bb72308a9eccb0c2f0d4ef21fc417&scene=21#wechat_redirect)[with界面新闻](https://mp.weixin.qq.com/s?__biz=MzIwNTA1MDA1NA==&mid=2650232871&idx=1&sn=ed33ca49983c99210cffa7582350bddb&scene=21#wechat_redirect)

端到端 模型的应用场景

Answer

References

端到端模型的应用场景