在过去 6 个月中,AI 技术和趋势呈现出以下特点:
在过去12个月里,人工智能行业是我们长期以来看到的最重要的技术发展之一。在我们研究的起始月份(2022年9月)期间,我们分析的工具产生了2.418亿次访问。正如您在图表中看到的,所有50个工具的总流量在研究期间增长了10.7倍。但在2023年8月的最后一个月,这些工具产生了惊人的28亿次访问量。从这个角度来看,从研究开始一个月到研究结束,流量增加了26亿。这相当于在研究的12个月内平均每月访问量增加2.363亿次。但这一切从哪里开始呢?这一飞跃真正从去年11月开始——当时ChatGPT成为有史以来最快达到100万用户的平台(仅用了5天)。在最初的繁荣之后,炒作一直持续攀升,直到2023年5月,月访问量达到峰值约41亿。这是我们第一次看到行业流量回落12亿。整个期间的平均流量为每月20亿。但有趣的是,如果我们只看最近6个月,每月平均流量为33亿。像人工智能这样的新兴技术趋势能引起如此大的兴趣是非常罕见的。即使在12亿次访问量回落和下降之后,人们的兴趣仍然巨大-行业总兴趣徘徊在上一年增长10.7倍左右。从这个角度来看,风投和投资者可以在人工智能竞赛中挑选几乎任何一匹大马,并在短短一年内安全地实现3-10倍的增长(假设兴趣反映在财务和用户基础上)。
1.模型✦过去两个月,我们共同见证了一场席卷全球AI领域的风云巨变。✦o1惊艳问世后,全世界的大模型团队都想找到OpenAI藏起来钥匙。没想到,最先踹开这扇门的是一家「名不见经传」的中国公司——DeepSeek。1月20日,DeepSeek宣布开源R1模型和相关论文,将整个大模型行业急速推进到了推理时代(Test-Time Scaling)。✦起初,我们以为这只是一次技术圈层的突破,完全没料到它会引发如此深刻的影响,甚至撼动了世界格局。美股暴跌1.2万亿,中美在AI领域频繁交锋;国内厂商纷纷接入R1并拉爆宣传,自家模型研发团队的脸面被按在地上摩擦;春节期间家喻户晓街头巷议,AI真正「飞入寻常百姓家」;而风暴中心的DeepSeek默默不语,只是不停地开源。✦Scaling Law再一次「续命」成功。这次的终点会是哪里呢?Sam Altman说是——AGI。2.图像✦图像模型近期没有大的突破,整体在往更快、更便宜的方向发展了。✦AI图像生成去年就已经跨过了真假难辨的临界点,成为最常用的生产力工具之一。从LibLibAI一年融资数亿就能看出来,资本市场已经非常看好这条赛道。3.视频✦视频模型的底层架构没有大的变化,大家都在做一些细节的优化,例如视频音效生成在逐渐成为标配。
✦现阶段,视频模型公司逐渐分化到两个方向:面向C端的视频模板方向,核心是好玩和快速,如Pixverse、Pika等;面向B端的视频创作方向,核心是高质量和高可控性,例如Minimax、Runway等。4.音频✦AI音频也在去年跨越了真假难辨的临界点。所以,音频领域是继图像领域之后,第二条被资本看好的AI赛道。5.3D✦3D领域变化不多,暂时还停留在文字/图片生成3D模型的阶段。世界模型才刚刚起步。6.应用✦AI编程领域仍然在快速迭代和发展。随着模型能力越来越强和推理模型的加入,编程从半自动到全自动,应该只是时间问题了。✦Computer Agent正在缓慢发展中。OpenAI发布的Operator工具,实测效果不尽如人意,还没有迈过实用性门槛。✦Deep(Re)Search这个方向值得注意。自从去年12月Google Gemini推出这项功能后,OpenAI、Perplexity,Grok等都迅速跟进。Deep(Re)Search本质上是一个调研Agent,通过大量搜索和分析,花较长的时间来生成一个长篇报告,与传统AI搜索相比更像是一种「慢搜索」。现阶段最大的问题是模型幻觉,特别是隐藏在一篇长文中的细节纰漏,因此实际使用还需要谨慎。7.新闻✦中美欧各有「星际之门」计划,2025年都将加大投入,支持AI基础建设和科学研究。✦越来越多的厂商接入R1,拥抱开源。