以下是关于 MPC 的相关材料:
https://x.com/alexalbert__/status/1861079762506252723Anthropic推出模型上下文协议(MCP)Claude Desktop现在可以直接连接到GitHub、创建新的存储库并创建PR模型上下文协议(MCP)简介我们在Anthropic一直在研究一个开放标准,它解决了LLM应用程序的核心挑战-将它们连接到您的数据。不再为每个数据源构建自定义集成。MCP提供一种协议来连接它们:
传统控制算法:模型预测控制(Model Predictive Control):通过预测未来系统行为来做出决策,在未来的一个给定时间窗口内解决一个最优化问题,以寻找控制输入,最小化成本并满足约束。MPC需要系统模型、成本函数、预测时间段、约束和反馈来运作,通过预测了未来会发生什么事情,机器人可以产生相应的动作来进行“预判”,在一定程度上加大了机器人的实用性。以足式机器人为例,一种使用方法是将MPC用于全身控制(Whole Body Control),由于利用MPC预测了未来一个预测时间步长的状态与控制序列,使得机器人可以协调身体的各个部分;可以通过观测到的地面环境提前给出相应的控制量,减缓欠驱动状态下的系统的不稳定性,通过优化得出最佳地面接触力作为控制量,在欠驱动状态下与地面的短时接触中,减少接触模态的干扰,增强四足的稳定性。此类路线的代表为波士顿动力,它的优点是传统算法可靠性高、可解释性强,而缺点是对于corner case(例如光滑地面)处理不好。第二阶段:采用深度强化学习
是Anthropic版本的Function Calling,只能用在客户端,需要开发能力。MCP的亮点是定义了一套标准且相对完善的协议,对于大模型和应用的生态协同有很大的指导意义。本质上是对LLM和API调用层进行的优化。Chat API的格式,大家基本都跟着OpenAI走了。Claude这把想让Agent API的格式,跟着他们走。https://www.anthropic.com/news/model-context-protocolhttps://m.okjike.com/originalPosts/67469876ba0429bf87824471[heading4]【模型】AndrewNG(吴恩达)●aisuite大模型套件开源[content]把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。切换模型时,只需要改动一个字符串,不用在不同的API之间摸不着头脑了。https://github.com/andrewyng/aisuite[heading4]【模型】阿里巴巴●Marco-o1开放型问题推理模型开源[content]模型通过思维链(CoT)微调、蒙特卡罗树搜索(MCTS)、反思机制和创新的推理策略提供支持。模型目标是解决这个问题:o1模型能否有效地推广到缺乏明确标准且奖励难以量化的更广泛领域?https://github.com/AIDC-AI/Marco-o1Hugging Face:https://huggingface.co/AIDC-AI/Marco-o1