Chat with Wiki - deepseek

Answer

DeepSeek 具有以下特点：

其秘方被认为是硅谷味儿的。将其比喻成“AI 界的拼多多”是偏颇的，早在 2024 年 5 月 DeepSeek-V2 发布时，就以多头潜在注意力机制（MLA）架构的创新在硅谷引发轰动，而在国内舆论场被描摹成“大模型价格战的发起者”。
如果 V-3 是 DeepSeek 的 GPT-3 时刻，接下来的发展充满未知，但它已成为中国最全球化的 AI 公司之一，赢得尊重的秘方也是硅谷味儿的。
华尔街分析师对 DeepSeek 有不同反应，其展示出媲美领先 AI 产品性能的模型，成本低，在全球主要市场的 App Store 登顶，但也有不同观点。
在实际使用体验方面，文字能力在中文场景中表现突出，数学能力经过优化不错，编程能力略逊于 GPT。GRPO 算法替代传统 PPO，降低价值函数估计难度，提高语言评价场景的灵活性与训练速度。
复旦大学 OpenMOSS 发布实时语音交互模型。

Content generated by AI large model, please carefully verify (powered by aily)

References

将DeepSeek比喻成“AI界的拼多多”是偏颇的，认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡，也都因为缺卡而拼命搞架构创新，这点没什么不同。要知道，DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候，它就以多头潜在注意力机制（MLA）架构的创新，在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时，一个非常有意思的现象是：X和Reddit上AI从业者在讨论DeepSeek-V2，同时，DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”，有点平行时空的感觉。这也许能说明：DeepSeek跟硅谷更有对话和交流的密码，它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻，那接下来将发生什么？是DeepSeek的GPT-3.5——也就是ChatGPT时刻，或是其它？没人知道，但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在，它也理应为全人类的人工智能事业做出更大的贡献。无论如何，DeepSeek已经是中国最全球化的AI公司之一，它赢得来自全球同行甚至对手的尊重的秘方，也是硅谷味儿的。

XiaoHu.AI日报

?Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️?华尔街分析师对DeepSeek的反应：DeepSeek展示出媲美领先AI产品性能的模型，但成本仅为其一小部分，在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热，Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局，降低AI行业进入门槛。?[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️?DeepSeek的实际使用体验：在文字能力上表现突出，尤其在中文场景中高度符合日常、写作习惯，但在专业论文总结方面稍弱。数学能力经过优化，表现不错；编程能力略逊于GPT，据用户反馈。GRPO算法替代传统PPO，降低价值函数估计难度，提高语言评价场景的灵活性与训练速度。?[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)?[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️?️复旦大学OpenMOSS发布实时语音交互模型：