Chat with Wiki - 目前deepseek的进展

Answer

目前 DeepSeek 的进展如下：

持续 5 天的“开源周”已进行到第 3 天。周一开源了专为英伟达 Hopper GPU 打造的高效 MLA 解码内核 FlashMLA，已正式投产使用。周二开源了专为混合专家系统（MoE）和专家并行（EP）设计的通信库 DeepEP。周三开源了支持稠密和 MoE 模型的 FP8 GEMM（通用矩阵乘法）计算库 DeepGEMM，可为 V3/R1 的训练和推理提供强大支持。总的来说，英伟达和 DeepSeek 开源的内容都是通过对英伟达 GPU 和集群的优化，来推动 AI 模型的高效计算和部署。
华尔街分析师对 DeepSeek 的反应：展示出媲美领先 AI 产品性能的模型，但成本仅为其一小部分，在全球主要市场的 App Store 登顶。Jefferies 警告其技术可能打破资本开支狂热，Citi 对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局，降低 AI 行业进入门槛。
DeepSeek 的实际使用体验：在文字能力上表现突出，尤其在中文场景中高度符合日常、写作习惯，但在专业论文总结方面稍弱。数学能力经过优化，表现不错；编程能力略逊于 GPT，据用户反馈。GRPO 算法替代传统 PPO，降低价值函数估计难度，提高语言评价场景的灵活性与训练速度。

Content generated by AI large model, please carefully verify (powered by aily)

References

英伟达下场，首次优化DeepSeek-R1！B200性能狂飙25倍，碾压H100

如今DeepSeek持续5天的「开源周」已经进行到了第3天。周一，他们开源了FlashMLA。这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核，特别针对变长序列进行了优化，目前已正式投产使用。周二开源了DeepEP，这是一个专为混合专家系统（MoE）和专家并行（EP）设计的通信库。周三开源的是DeepGEMM。这是一个支持稠密和MoE模型的FP8 GEMM（通用矩阵乘法）计算库，可为V3/R1的训练和推理提供强大支持。总的来说，不管是英伟达开源的DeepSeek-R1-FP4，还是DeepSeek开源的三个仓库，都是通过对英伟达GPU和集群的优化，来推动AI模型的高效计算和部署。参考资料：https://x.com/NVIDIAAIDev/status/1894172956726890623

XiaoHu.AI日报

?Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️?华尔街分析师对DeepSeek的反应：DeepSeek展示出媲美领先AI产品性能的模型，但成本仅为其一小部分，在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热，Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局，降低AI行业进入门槛。?[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️?DeepSeek的实际使用体验：在文字能力上表现突出，尤其在中文场景中高度符合日常、写作习惯，但在专业论文总结方面稍弱。数学能力经过优化，表现不错；编程能力略逊于GPT，据用户反馈。GRPO算法替代传统PPO，降低价值函数估计难度，提高语言评价场景的灵活性与训练速度。?[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)?[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️?️复旦大学OpenMOSS发布实时语音交互模型：

XiaoHu.AI日报