**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。
据SensorTower统计,2024全年全球AI移动应用内付费收入预计为30亿美元,其中图像和视频类AI应用占据主导地位,收入占比高达53%;对话机器人类别排名第二,占比29%;其他类别合计不足20%。从地区分布来看,北美和欧洲贡献了三分之二的市场份额,是AI应用的主要消费市场。这也是众多中国AI公司积极出海的重要原因之一。▎云厂商成为AI供应链的“链主”美国红杉资本在《The AI Supply Chain Tug of War》一文中指出,AI供应链当前呈现出一种脆弱的平衡状态。他们将AI供应链从下到上分为六层,各层的盈利能力存在显著差异。第一层的芯片代工厂(如台积电)和第二层的芯片设计商(如英伟达)是当前的主要赢家,依然保持高利润水平;第三层的工业能源供应商(如电力公司)也因数据中心需求激增而受益良多。而作为供应链核心承载方的第四层云厂商,却处于重金投入阶段,不仅斥巨资建设数据中心,还在训练自有模型或大举投资AI模型开发商,处于供应链第五层的AI模型开发商目前同样面临亏损。供应链的第六层,也就是最上层则是面向最终客户的应用服务商。尽管充满潜力,但他们依赖消费者和企业付费,当前市场规模有限,尚不足以支撑整个供应链的经济模型。这使得大型云厂商成为整个供应链最主要的风险承担者。作为AI产业的中枢,云厂商不仅掌握着庞大的商业生态和技术资源,还拥有数千亿美元的市场规模。正因如此,它们在产业链中的地位无可撼动,是毋庸置疑的“链主”。▎行业格局:头部阵营基本稳定1、头部大模型
正确预测1.好莱坞级别的制作公司开始使用生成式人工智能来制作视觉特效。证据:虽然大部分效果还不理想,但生成式人工智能视觉特效已经在Netflix和HBO的作品中出现。2.美国联邦贸易委员会(FTC)或英国竞争与市场管理局(CMA)基于竞争理由调查微软/OpenAI的交易。证据:两个监管机构都在调查合作伙伴关系。3.在全球人工智能治理方面,进展非常有限,会超出高层次的主动承诺(high-level voluntary commitments)。证据:是的,来自布莱切利和首尔峰会的承诺仍然是自愿和高层次的。4.一首由人工智能创作的歌曲进入公告牌Hot 100前10名或Spotify 2024年热门榜单。证据:歌曲「Heart on My Sleeve」就是例子,也可以看到一首由人工智能创作的歌曲在德国中位列第27名,并保持了几天。5.随着推理工作负载和成本的显著增长,一家大型人工智能公司(例如OpenAI)收购或建立了一个专注于推理的人工智能芯片公司。证据:据报道Sam Altman正在筹集大量资金来实现,而谷歌、亚马逊、Meta和微软等公司也在继续构建和改进他们自己的人工智能芯片。错误预测1.有生成式人工智能媒体公司因其在2024年美国选举期间的滥用行为受到调查。解释:目前还没有,但让子弹飞一会。2.自我改进的人工智能智能体在复杂环境中(例如AAA级游戏、工具使用、科学探索)超越了现有技术的最高水平。解释:还没有,尽管在开放性方面有一些比较有前景的工作,如在游戏上的强劲表现。3.科技IPO市场解冻,至少看到一家以人工智能为重点的公司上市(例如DBRX)。