WhatsApp一直说时间
过去一年的诸多进展感到兴奋,对新的一年 AI 的发展更是充满期待,尽管他们对未来的预测可能不尽相同。Ashu Grag 回顾了 2024 年 AI 发展的里程碑事件,并重点介绍了 2025 年的前景,
1. 预训练局限将推动新的 AI 突破2. AI 系统将比模型更重要3. AI 将重置软件经济学的规则4. 英伟达 AI 硬件垄断地位即终结5. AI 原生初创公司取代软件巨头6. AI 界面超越聊天框7.传统搜索方式将终结
翻译|张雪聃题图|SiliconCloud平台模型2024 年技术的发展可以用一个数字来概括:1000 倍。
这是机器智能成本在仅三年间下降的倍数——从 2021 年 GPT-3 每百万词元 60 美元,到 Meta 的 Llama 3.2 降至每百万词元0.06 美元。据我所知,这种技术能力的迅速普及在人类历史上前所未有。智能曾经是人类最珍贵和稀缺的资源,如今正变得无处不在、丰富且几乎免费。
这一发展重新点燃了许多人已经因 2022 年经济低迷而熄灭的技术乐观主义。市场显然注意到了这一点:人工智能如今大约占据了标准普尔 500 指数市值的一半,其影响力已远远超出了“七大科技巨头”,渗透到工业和公共事业等各个领域。
更为显著的是,我们迅速地将 AI 的规模扩展能力视为常态。两年前看似不可能完成的任务——复杂的逻辑推理、端到端任务的完成以及在基准测试中表现极为出色——如今几乎无需提及。随着我们对如何实现这些目标的理解不断发展(后文将会详述),对“AI”定义的前沿也在不断推进。
作为投资者和硅谷创始人的拥护者,看到这一地区反击了十多年来的“死亡预言”,尤其令我感到欣慰。“硅谷的死亡”这一说法被证明是极为错误的。相反,硅谷作为全球 AI 神经中枢更加繁荣,汇聚了许多领先的 AI 实验室和初创公司,预计这一趋势将在 2025 年更加突出。
在 2024 年,我和我的团队记录并预见了许多这些变化——从“软件即服务”到“服务即软件”,从“复合 AI 系统”到“智能体系统”,以及基于 transformer 模型的替代方案的崛起。
正如我上个月所记录的,扩展预训练的假定进展已遇到三大障碍:数据、计算/能源和模型架构。然而,在 2025 年,这些障碍不会限制 AI 的进步——它们将引导 AI 朝着新的前沿发展。
其中一个最有前景的前沿是“逻辑推理(reasoning)”——在这一领域,模型不仅仅是从训练中回忆出模式,而是在推理(inference)过程中积极解决问题。以OpenAI的 o3 模型为例:它不是立刻给出答案,而是生成详细的推理路径,针对每个任务量身定制,类似于数学家系统地推导一个证明。
报告的结果令人震惊:o3在 ARC-AGI 奖项上取得了 87.5% 的成绩,在 FrontierMath(由菲尔兹奖得主编写的专业数学测试 , 之前的模型最高成绩为 2%)上取得了 25% 的成绩。为了更好地理解这一飞跃:GPT-3 到 GPT-4 在 ARC-AGI 上的表现从 0% 逐渐提升到 5%,这一过程花费了四年时间。根据 ARC 创始人和资深 AI 研究员 François Chollet的说法,o3 代表了 AI 在处理新情境时的根本性能力突破。
这种推理策略有其代价:o3 的顶级版本比基础版需要多出 172 倍的计算量,每个答案的成本超过 3400 美元。不过,如果过去三年有给我们带来什么启示,那就是这些成本往往会迅速下降。更高效的训练和更复杂逻辑推理的结合表明,2025 年 AI 的进步可能超越 2024年的惊人成果。
这种关于测试时计算方式的演变引出了我的下一个观点:未来属于那些设计最高效能 AI 系统的人,而不是那些拥有最大模型的人。
孤立的 AI 模型不过是磁盘上的比特。即使是最简单的输出,也需要至少三个组件协同工作:一个提示词,一个生成输出的采样方法,以及一个评估结果的验证策略。我们所感知到的“智能”和“逻辑推理”,实际上来自于这些元素与外部工具和 API 的精心协调。当我们惊叹于像 o3 模型解决问题的能力时,我们实际上在观察多个专门组件之间的精密编排:一个生成可能的解决方案,另一个验证它们,还有其他组件用于优化和改进结果。
尽管过去四年都由规模扩展的竞争占据主导地位,但 2025 年将由那些掌握系统级架构的研究者和构建者所塑造。我们将看到的突破,不仅仅是训练更大的模型,而是寻找更加优雅和有效的方式来组合多个较小的模型和软件组件。从“模型中心”思维转向“系统中心”思维,将开始削弱现有企业的资本优势,并惠及那些能够快速行动和进行实验的初创公司。
2025 年,AI 公司将突破传统软件预算的限制,瞄准更为庞大的服务市场——总可寻址市场(TAM)扩展约 10 倍,将通过出售实际的工作完成,而不仅仅是通过工作流支持取得成功。
这种基于结果的定价模式对传统企业造成了典型的创新者困境。它们的收入模型、销售激励和市场推广策略是围绕销售席位和许可证进行优化。这为构建以 AI 能力为核心的商业模式的初创公司提供了巨大的机会。
与此同时,AI 正在颠覆软件行业的核心假设——规模化后边际成本接近于零。目前,向更高模型性能迈进的每一步都需要成倍增加的资源。一款准确率为 90% 的聊天机器人可能每个用户花费 10 美元 , 但如果要达到 99.9% 的准确率,在考虑底层计算成本后,可能需要每个用户支付 1000 美元。
我们目前已经看到了这种定价结构的出现,OpenAI 最近的订阅计划达到每月 200 美元,其专业版计划还有讨论为每月 2000 美元。尽管这些费用相比最初每月20 美元的计划看起来较高,但与人类专业知识相比,这个价格显得适中。
展望未来,随着像 o3 这样的模型推动逻辑推理时间延长到“数小时、数天甚至数周”,订阅模式本身可能变得过时——这为以 AI 为核心的初创公司提供了另一项优势,尤其是与仍固守传统定价模型的传统企业相比。
2024 年,AI 硬件的发展在很大程度上是由 NVIDIA 的发展所主导的——其在 AI 芯片领域的近乎垄断推动了公司市值达到 3.3 万亿美元。然而,2025 年将书写一个不同的故事,竞争的加剧和 AI 系统计算资源消耗方式的转变将成为驱动力。
巩固 NVIDIA 主导地位的挑战——预训练——本质上是一个吞吐量问题。它需要庞大的芯片集群在满负荷运转数月的情况下并行处理庞大的数据 batch。NVIDIA 凭借构建一个优化硬件和软件的集成堆栈,专为这些高度集中的、可预测的工作负载而设计,表现出色。然而,推理任务面临着不同的挑战:工作负载是间歇性的且难以预测,时延比原始吞吐量更为重要,计算需要在边缘进行,而非集中在数据中心。
2025 年的 AI 基础设施格局可能会变得更加分散和异构,优化的重点将是与今天庞大的 GPU 集群不同的权衡。虽然 NVIDIA 并没有停滞不前,但竞争者的机会仍然很大——既有来自科技巨头(如苹果、AMD、微软、Meta、谷歌、亚马逊和特斯拉等)的定制芯片, 也有来自创新初创公司的挑战。问题不在于 NVIDIA 是否还能保持作为主要玩家的地位(他们当然会),而是他们是否能维持其近乎垄断的地位。
2025 年将见证一代新企业软件巨头的崛起。这些新巨头将不再是传统的系统上加装 AI 功能的“拼装”软件,而是 AI 原生的平台,重新定义软件的工作方式。企业 AI 软件的支出已经激增,从 2023 年的 6 亿美元增长到 46 亿美元——而这只是开始,因为我们的“服务即软件”范式正在深入人心。
让我们将目光转到 CRM 领域,这是企业软件最根深蒂固的市场之一。当前的记录系统——Salesforce、Hubspot 等——围绕结构化的数据表示构建,通常是文本格式的。一个 AI 原生的销售平台不仅仅是为这个陈旧的模型增加功能,而是将核心系统重新构想为一个多模态的大脑,能够处理并对文本、图像、语音和视频进行操作。
当底层技术的变化如此深刻时,现有企业的分销壁垒——通常是初创公司难以逾越的障碍——变得不那么重要。销售团队之所以采纳AI 原生平台,不是因为它们在功能上逐步改进,而是因为它们可以消除从潜在客户研究到电话准备,再到宣传材料的制作的整个类别的工作。
尽管云计算和移动技术各自诞生了约二十家年收入超过十亿美元的初创公司WhatsApp一直说时间,这些公司必须找到狭窄的垂直细分市场来竞争。而现在,AI 的进步使得初创公司能够对几乎所有主要类别的企业软件发起正面攻击——从销售和营销自动化到 ERP 和财务规划。任何基于结构化数据、以文本为主的传统软件都都可能变得过时。
到 2025 年底,定义早期 AI 产品的简单聊天框将变得像命令行一样过时。我们将看到不同类型的工作出现专门的用户界面(UI):用于监控 AI 过程的互动仪表盘、使 AI 逻辑推理过程透明并可调试的可视化工具,以及用于创意合作的直观界面。这些新界面意味着 AI 不仅仅是一个问答系统,而是一个我们需要以更高级的方式引导、监控和协作的复杂工具。
随着模型能力的融合,关键的区分因素可能将是用户体验(UX)——不仅是表面层次的设计选择,更是在更深层次上,如何有效地与 AI 合作,并利用其能力。在这个领域的赢家不仅会构建强大的模型;他们还将构建能够让 AI 的能力变得可接触且可控的界面和体验。
Google 著名的“10 个蓝色链接”定义了我们如何在线获取信息,并塑造了现代网络的架构。但到 2025 年,我们将见证这个存在数十年的范式的终结,因为 AI 原生的信息获取方式使传统搜索结果变得过时。
这一转变已经在进行中。像 Perplexity 和 ChatGPT(最近增加了网页搜索)这样的平台展示了直接、综合的答案如何优于通过充斥广告的链接列表进行滚动查找。更重要的是,它们正在培养新一代互联网用户,这些用户本能地会“聊天”而不是去搜索。
Meta 潜在的搜索业务进入可能加速 Google 的衰落。它们的社交图谱提供了 Google 索引所缺乏的东西:实时理解信息如何通过人际网络流动。根据一项估计,Meta 可以访问比公开互联网多 100 倍的数据(),前提是,它们能够应对使用这些数据时复杂的合规要求。Meta 的搜索产品可能会以传统网页内容、社交信号和 AI 综合处理的方式结合起来,从而使 Google 当前的产品显得静态且脱节。
Google 的广告收入是构建现代网络的经济引擎,但在同时保护这一收入的同时推出其替代品,这可能被证明是不可行的。美国司法部的反垄断审查,包括强制搜索索引许可的讨论,进一步复杂化了 Google 在这个新的 AI 时代利用现有优势的能力。
技术史上充满了先驱者——Yahoo、Netscape、MySpace 等——他们催生了革命性的变化,却未能抓住其价值。到 2025 年,OpenAI 可能会加入这些先驱的行列。尽管像 o3 这样的模型在技术上取得了令人印象深刻的成就,但它们最近 1570 亿美元的估值看起来越来越像是在为一个市场的永久主导地位定价,而这个市场的竞争每天都在加剧。
Google 的 Gemini 已经在多个关键行业基准测试中超越了 GPT-4,而 Meta 的开源策略则以一半的成本提供了相当的能力。当 Llama 3 为 Facebook、Instagram 和 WhatsApp 提供免费的 AI 功能,覆盖 40 亿用户时,ChatGPT 的 1000 万付费用户开始看起来不像是市场主导,反而像是脆弱的初期领先。
开源进展同样引人注目——这些模型在几乎所有重要的基准测试中,现已与它们的封闭版本不相上下。举个例子,Llama 3.1 405B在MMLU 测试中,仅比 Claude 3.5 Sonnet 和 GPT-4 Turbo 稍逊一筹。
企业支出模式也支持了这些评估。Ramp 的数据显示,OpenAI 在其平台上的客户支出份额从 90% 下降至 76%。企业正在采用多模型策略,并建立基础设施以便于在不同服务提供商之间切换。事实证明,单纯在模型开发上的卓越表现并不能创造客户粘性。
2025 年还需关注其他动态:OpenAI 计划作为营利公司进行重组以及与 Microsoft 的关系。根据目前的协议,Microsoft 在实现 AGI 之前对 OpenAI 的知识产权拥有完全的权利。这为 OpenAI 何时宣布已达成这一里程碑创造了有趣的激励结构——特别是考虑到公司宣称的使命是无论如何都要追求 AGI。
2025 年,Meta 的 Llama 架构将成为 AI 领域中的标准,类似于 Linux 在服务器领域的地位——定义了 AI 系统的构建和部署方式。基于 Llama 的开发将使开发者能够利用一个围绕它优化的完整生态系统,从硬件和开发工具到训练和部署流水线。
这标志着与 2022-2023 年AI 开发范式的决裂,那时进入模型领域意味着,筹集数亿资金仅用于初步的训练。那时的问题不是“我们能采取什么创新方法?”而是“我们能否访问一个 100000 块 GPU 集群?”到 2025 年,随着开源和模型蒸馏的持续进展,小型团队将越来越多地与大型实验室竞争——特别是在那些特定垂直领域和“最后一公里”应用场景中,专业知识比规模更为重要。
到 2025 年,自动驾驶汽车将通过让机器智能变得可见且不容置疑,从而改变公众对 AI 的信任。虽然我们可以辩论一个聊天机器人的能力,但对于一个比人类驾驶更安全地行驶的 AI,我们无话可说。这种日常生活中 AI 社会效益的实际证明,将比任何模型突破都能更有力地赢得公众对这项技术的信任。
截至 2024 年中,Waymo 的自动驾驶出租车已经行驶超过 2200 万英里,其中包括在旧金山的 590 万英里,Waymo 的白色捷豹 SUV 已经成为城市景观的一部分。上个周末,我亲眼看到一辆自动驾驶车在拥挤的停车场中行驶——这是一个连最有经验的人类司机也会感到犹豫的场景。
看到我们无司机的未来继续实现——无论是在安全性、可访问性、城市设计、人类生产力还是整体生活质量方面的积极影响——这是我在 2025 年最期待的进展之一。
2024 年,AI 生态系统变得更加友好,尤其是对初创公司——开源模型与封闭模型相匹配,小型模型迅速取得进展,推理策略的重要性超过了单纯的原始规模扩展,企业也开始接受 AI 原生解决方案。2025 年,这一趋势将加速发展,随着系统超越模型,界面演变超越聊天框,初创公司将对行业巨头发动正面攻击。
我们越深入这场 AI 革命,我对什么是可能的、什么是不可能的理解就越不确定。这正是这一时刻如此令人兴奋的原因——我们面临的限制不再是 AI 能做什么,而是构建者能够想象用 AI 做什么。我们正在从一个由技术壁垒定义的时代,进入一个仅由人类创造力和抱负所限制的时代。