Chat with Wiki - deepseek本地部署

Answer

以下是关于 DeepSeek 本地部署的相关信息：

「AI 实训营」第三期课程中，02 月 26 日 20:00 的课程涉及人工智能平台 PAI 篇，包括 DeepSeek R1 技术原理、解锁 DeepSeek 的不同玩法（如问答助手、蒸馏、微调），以及实战演练 DeepSeek R1 满血版快速部署和蒸馏训练，相关课程文档为用阿里云 PAI 复现 Deepseek 蒸馏.pdf 。
02 月 26 日的智能纪要中提到，关于本地部署的介绍包括如果拥有云服务器如何进行本地部署，以及满血版本地部署的实际情况。同时提到在 freely.aliyun.com 可领取 500 元免费额度，但有使用限制，不能部署满血版和较大的增流模型，还介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。

Content generated by AI large model, please carefully verify (powered by aily)

References

|时间|主题|课程内容|课程文档||-|-|-|-||02/25 20:00|#阿里云百炼篇：用DeepSeek搭建智能体|阿里云百炼满血版DeepSeek介绍<br>基于阿里云百炼的DeepSeek智能体搭建|[尝鲜阿里云百炼上的DeepSeek玩法.pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/RSqWbr9FzozYSsxehRDc0iNVnWe?allow_redirect=1)||02/26 20:00|#人工智能平台PAI篇：本地部署满血版DeepSeek|DeepSeek R1技术原理<br>解锁DeepSeek的不同玩法：问答助手？蒸馏？微调？<br>实战演练：DeepSeek R1满血版快速部署&蒸馏训练|[用阿里云PAI复现Deepseek蒸馏.pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/HWHTbXYWYoc0t8xsSk0cNalTnGg?allow_redirect=1)|

智能纪要：02-25 | 最新的DeepSeek玩法教学 2025年2月25日

[01:57:41](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=7061000)大模型及知识库使用讲解与问题解答本章节许键介绍模型API调用方法与知识库创建。告知获取API key位置及调用设置，详细讲解创建Rag应用（知识库）流程，包括上传非结构化文件、数据解析、切分段落等操作，还回答诸多问题，如知识库访问权限、智能体接收文档等，并提及作业是构建常用应用。[02:15:10](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=8110000)工作流创建、模型能力及相关问题探讨本章节主要讨论工作流相关问题。涉及历史版本功能，如对话流不支持上传文档，可向百练提需求；探讨了根据小说写序章、英文翻译、文字校对等工作流搭建；解释了模型能力、query概念；还提到工作流发布渠道、联网搜索网站设置及根据用户语言回复等内容。[02:22:50](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=8570000)通义千问相关应用及明天课程安排交流本章节主要讨论智能体相关内容，包括图片识别后让大语言模型回答防治方法，智能体应用及工作流概念、工具添加等。还提及明天将教Deepseek本地部署、蒸馏模型部署及微调，分享了发布智能体消耗token等情况，最后回答了一些问题并预告通义千问推理模型进展。

智能纪要：02-26 | DeepSeek部署+蒸馏 2025年2月26日

关于AI模型部署与相关知识的讲解本地部署介绍：讲解了如果拥有云服务器如何进行本地部署，以及满血版本地部署的实际情况。免费额度说明：指出在freely.aliyun.com可领取500元免费额度，但有使用限制，不能部署满血版和较大的增流模型。平台服务差异：介绍了DLC、DSW和EAS等模型部署平台服务的差别。模型蒸馏微调：会带着大家复现模型的蒸馏和微调，并讲解相关知识。Deepseek R1模型的制作及相关模型比较R1模型的强化学习：通过强化学习，在训练过程中给予模型反馈，如路线规划是否成功到达终点、输出格式是否符合期望等，对正确路线增强权重，使做对的概率变高，导致思考逻辑变长。R1模型的蒸馏与微调：用Deepseek RE Zero蒸馏出带思考的数据，基于Deepseek V3微调，进行冷启动，再做强化学习，还从非公布模型提取微调数据，加上人类偏好，最终形成R1。R1与其他模型的差别：R1是原生通过强化学习训练出的模型，蒸馏模型是基于数据微调出来的，基础模型能力强，蒸馏微调模型能力也会强。模型的相互帮助：Deepseek R1反过来蒸馏数据微调V3，形成互相帮助的局面，使两个模型都更强。