Chat with Wiki - deepseek

Answer

DeepSeek 具有以下特点：

其秘方被认为是硅谷味儿的。将其比喻成“AI 界的拼多多”是偏颇的，早在 2024 年 5 月 DeepSeek-V2 发布时，就以多头潜在注意力机制（MLA）架构的创新在硅谷引发轰动，而当时在国内舆论场被描摹成“大模型价格战的发起者”。
如果 V-3 是 DeepSeek 的 GPT-3 时刻，接下来的发展未知，但它已成为中国最全球化的 AI 公司之一，赢得尊重的秘方也是硅谷味儿的。
华尔街分析师对 DeepSeek 有不同反应，如 Jefferies 警告其技术可能打破资本开支狂热，Citi 对其技术突破提出质疑，高盛预测其可能改变竞争格局等。
在实际使用体验方面，文字能力在中文场景中表现突出，符合日常写作习惯，但在专业论文总结方面稍弱；数学能力经过优化表现不错，编程能力略逊于 GPT。GRPO 算法替代传统 PPO，降低价值函数估计难度，提高语言评价场景的灵活性与训练速度。

Content generated by AI large model, please carefully verify (powered by aily)

References

将DeepSeek比喻成“AI界的拼多多”是偏颇的，认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡，也都因为缺卡而拼命搞架构创新，这点没什么不同。要知道，DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候，它就以多头潜在注意力机制（MLA）架构的创新，在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时，一个非常有意思的现象是：X和Reddit上AI从业者在讨论DeepSeek-V2，同时，DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”，有点平行时空的感觉。这也许能说明：DeepSeek跟硅谷更有对话和交流的密码，它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻，那接下来将发生什么？是DeepSeek的GPT-3.5——也就是ChatGPT时刻，或是其它？没人知道，但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在，它也理应为全人类的人工智能事业做出更大的贡献。无论如何，DeepSeek已经是中国最全球化的AI公司之一，它赢得来自全球同行甚至对手的尊重的秘方，也是硅谷味儿的。

XiaoHu.AI日报

?Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️?华尔街分析师对DeepSeek的反应：DeepSeek展示出媲美领先AI产品性能的模型，但成本仅为其一小部分，在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热，Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局，降低AI行业进入门槛。?[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️?DeepSeek的实际使用体验：在文字能力上表现突出，尤其在中文场景中高度符合日常、写作习惯，但在专业论文总结方面稍弱。数学能力经过优化，表现不错；编程能力略逊于GPT，据用户反馈。GRPO算法替代传统PPO，降低价值函数估计难度，提高语言评价场景的灵活性与训练速度。?[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)?[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️?️复旦大学OpenMOSS发布实时语音交互模型：