ip代理http爬虫代理服务器
智东西2月20日报道,今日,在微软连发其首款量子芯片、首个游戏世界模型两大重磅研究成果后,知名科技播客Dwarkesh Podcast第一时间放出对微软董事长兼CEO萨蒂亚纳德拉的76分钟深度访谈,信息量非常大。
访谈涵盖了包含微软对AI发展走向、计算资源需求、集群建设、通用人工智能(AGI)基准、AI价格战、部署AI能力的挑战、量子计算突破、游戏世界模型、混合现实(MR)梦想、企业如何培养员工忠诚度、认知劳动等话题。
纳德拉说,AI需要变得更好且更便宜,每当有像DeepSeek所取得的这种突破时,每个Token的性能效率前沿就会改变,这将带来更多的需求。
今年是微软成立50周年。纳德拉希望保持“重新创业”心态,谈到微软想要下得三大赌注是AI、量子计算、MR,认为新发布的游戏世界模型Muse AI具有类似于“ChatGPT时刻”的里程碑意义,真实临场感仍是MR难以解决的挑战,并判断计算资源价格会下降、SaaS行业将被AI重塑。
在他看来,赢家通吃不会出现在超大规模市场,可能会出现在消费市场;在大模型领域,开源方案会确保闭源赢家通吃的局面得到缓解,不会出现某家凭借一个模型独占市场的情况。
在访谈期间,他还分享了微软曾经失误所带来的一些教训,比如错过搜索,比如微软亚研院曾有上千个本应大力推进却没有的项目,并复盘原因是缺乏足够的信心,对接纳创新和将其转化成商业模式缺乏完整的思考。
主持人:祝贺你,微软刚刚取得两项突破,同一天在Nature上发表的量子处理器Majorana 1和首个世界和人类行动模型。不过首先我们能不能继续刚才的线年代看到的事情以及你看到它们再次发生的感受。
让我兴奋的是,这让我想起了我在科技行业的最初几年,从90年代开始,那里有对RISC(精简指令集)还是CISC(复杂指令集)的真实争论,或者“我们线构建服务器吗”等争论。
我加入微软时正是Windows NT(面向工作站、网络服务器和大型计算机的网络操作系统系列)项目起步的时候。所以,从核心芯片平台到操作系统,再到应用程序层级,全栈式方案的整个体系都在不断地深入研究和完善中。
当时分布式计算和云改变了客户端-服务器,网络发生了巨大的变化,相比于过去感觉更像一个完整的堆栈,而我参与其中。
主持人:此前人们谈论数据中心建设是一个泡沫,但我们今天的互联网又是基于其建设而成。所以关于什么将经得起时间的考验?什么是固有的长期趋势?什么只是昙花一现?你如何看待。
纳德拉:回顾我经历过的四大变革,其中之一就是客户端以及客户端-服务器模式,也就是GUI(图形用户界面)和x86架构的诞生,基本上正是它们让我们能够构建服务器。
我很清楚这一点。我记得1991年参加PDC大会时,我在Sun Microsystems(IT及互联网技术服务公司)工作。1991年我去了Moscone。当时微软首次描述了Win32接口,我很清楚接下来会发生什么——服务器将采用x86架构。
因此,当你拥有规模优势时,这就是你必须下注的长期赌注。客户端发生的事情也将在服务器端发生,然后你就可以真正构建客户端-服务器应用程序。应用程序的模式变得清晰起来。
那时网络发展对我们来说是件大事,我们在创业之初就必须应对它。我一加入微软,Netscape浏览器或Mosaic浏览器问世,大概在1993年12月左右,这些浏览器被开发出来。
所以,这在某种程度上改变了游戏规则。当时我们正处于客户端-服务器浪潮之中,很明显我们赢得了这场竞赛。
之后我们迎来浏览器时代,因此必须做出调整。我们很好地适应了浏览器时代新的应用模式。我们将其融入到微软所做的一切中,无论是Word中的HTML还是其他新东西,然后在服务器堆栈上构建网络服务器等。
当然,我们也错过了网络上最大的商业模式。因为我们都认为网络是分布式的,谁会想到搜索会成为组织网络的最大赢家?显然,这是我们没有看到的地方,而谷歌看到了它并执行得非常好。
所以这是我学到的一个教训:你不仅要正确把握技术趋势,还要了解该趋势将创造什么价值,这些商业模式的转变可能比技术趋势的变化还要困难。
其一是表现出色的超大规模云服务提供商,因为从根本上来说,如果你回想一下萨姆阿尔特曼(OpenAI CEO)和其他人的描述就会发现,智能程度与计算能力呈对数相关,因此谁能够进行大量的计算,谁就是大赢家。
其二,如果你仔细观察ChatGPT等任何AI工作负载,你会发现并不是每个人都对GPU方面发生的事情感到兴奋,虽然GPU方面的发展确实很不错。实际上,我在考虑自己的设备集群时,会将其看作是AI加速器、存储和计算之间的一种比例关系。而且从规模角度来看,你必须对其进行扩展。
因此,世界对基础设施的需求将呈指数级增长。拥有这些AI工作负载简直就是天赐良机,它们对更多计算能力的需求极大,而且不仅仅是在训练方面,在测试阶段同样如此。
当你想到一个AI agent时,事实证明,AI agent会以指数级的速度增加计算资源的使用量,因为这已不再仅仅局限于一个人调用一个程序,而是一个人调用的程序会进而调用更多的程序。这将会对计算基础设施产生巨大无比的需求,并推动其规模不断扩大。
所以,我们的超大规模业务,也就是微软的Azure业务,以及其他超大规模云服务提供商的业务,我认为这都是非常重要的发展方向。
在那之后,情况就变得有点模糊了。你可能会说“嘿,存在一种赢者通吃的模式”,但我就是不这么认为。
顺便说一下,这是我学到的另一件事:在某种意义上,真正擅长分辨哪些是赢者通吃的市场,哪些不是赢者通吃的市场,这才是关键所在。
我还记得,在我刚涉足Azure业务的早期,亚马逊就已经遥遥领先了。人们会来找我,投资者也会找到我,他们说:“哦,一切都结束了。你们永远也做不成的。亚马逊是赢者通吃的,这已经是定局了。”
在客户端-服务器领域,甲骨文与IBM竞争的经历让我明白,买家是不会容忍“赢者通吃”的局面的。
消费市场有时可能会出现 “赢者通吃” 的情况,但只要买家是企业、公司或企业的IT部门,他们就会希望有多个供应商。所以,你必须成为众多供应商中的一员。
我认为,大模型领域也会是这样的情况,会有开源模型、监管机制等。就像Windows系统给我的一个重要教训:如果你有一个闭源操作系统,就必然会有与之互补的开源产品出现。所以在某种程度上,这确实能对市场情况起到制衡作用。
我觉得在模型方面,或许会有一些闭源模型,但肯定也会有开源的替代方案。而且开源的替代方案会确保那种闭源 “赢者通吃” 的局面得到缓解。
顺便说一下,如果AI真的像人们所认为的那样强大,政府是不会坐视不管任由私营企业在全球范围内随意发展的。
除此之外,我认为情况还是和以往一样,在消费领域的某些品类中,可能会出现一些 “赢者通吃” 的网络效应。
毕竟ChatGPT就是一个很好的例子。它是一个大规模的消费级产品,已经获得了真正的发展动力。我打开应用商店,总能看到它排在前五名,我就会感叹:“哇,这太不可思议了。”
所以他们能够利用早期的优势,并将其转化为应用程序方面的优势。在消费领域,这种情况是可能发生的。但在企业领域,我认为按不同类别划分,会有不同的赢家。至少这是我分析得出的结论。
主持人:如果拥有了通用人工智能(AGI),并且它能帮助你开发出更好的AI,也许未来会出现自动化的AI研究工具等,来巩固企业自身优势,我很好奇你的想法,在这个领域保持领先真的很重要。
纳德拉:从模型的角度来看,没有什么东西是完全商品化的。就你提到的云计算来说,大家都会说:“哦,云计算是商品化的产品。” 但实际上ip代理http爬虫代理服务器,当你扩大规模,这就是为什么运营超大规模云服务需要专业知识, 你可能会说:“哎呀,这有什么难的?我只要把服务器组装起来就行了。”
事实上,在超大规模云服务发展的早期,大多数人都认为 :“市场上有那么多托管服务提供商,他们的业务都不怎么样。超大规模云服务会有前景吗?这到底能不能成为一门生意呢?” 但结果证明,这确实是一门实实在在的生意,这就是因为具备了运营的专业知识。以Azure为例,要在全球60多个地区运营计算业务,管理所有的计算资源,这可不是件容易复制的事情。
所以我想说的重点是,市场上会只有一个赢家吗?这到底是不是 “赢者通吃” 的局面呢?因为你必须搞清楚这一点。
我喜欢进入那些市场总量(TAM)很大的领域,在这样的领域里,你不必承担所有的风险,因为不会出现 “赢者通吃” 的情况。最理想的情况是进入一个大市场,这个市场能够容纳几个赢家,而你就是其中之一。
这就是超大规模云服务层面的情况。模型最终需要在超大规模的计算资源上运行。所以我觉得这种联系会一直存在。
同时,这不仅仅是模型的问题。模型需要状态存储,这意味着它需要存储设备,而且运行这些agent及其运行环境也需要常规的计算资源。
主持人:作为超大规模云服务提供商,在推理阶段的规模扩展方面,微软不仅可以将数据中心和GPU用于训练,还可以再次用于推理,从而分摊成本。那你认为微软和Azure属于哪一类超大规模云服务提供商呢?是专注于预训练方面吗?还是提供像o3类型的推理服务呢?或者你们只是会托管和部署市场上的任何一种模型,对此并不偏袒呢?
我认为这就和我们过去做其他事情一样:每年都对设备集群进行更新,根据设备的使用寿命对其进行折旧处理,然后非常熟练地对设备集群进行布局,这样就能以高利用率运行不同的任务。
有时候会有非常大型的训练任务,需要为其配置高度集中的峰值运算能力,而且这些任务还需要协同运行。因此我们应该拥有足够的数据中心规模来满足这一需求。
但归根结底,这些任务规模都会变得非常庞大,即使从预训练的规模来看,如果要持续发展,在某个阶段预训练的规模也必须跨越数据中心的界限。基本上就是这样的情况。
所以,一旦你开始跨越预训练的数据中心界限,这和其他情况有什么不同吗?我是这样想的:分布式计算仍然是分布式的,所以构建你的设备集群,使其能够应对大型训练任务,能够满足测试阶段的计算需求,甚至能够应对强化学习(RL)可能带来的情况。
你构建了一个大模型,然后会有大量的强化学习任务要处理。对我来说,这就像是更多的训练运算,为不同的任务创建高度专业化、精简的模型。
说到底,光速是固定的。你不能只在得克萨斯州建一个数据中心,然后说:“我要从这里为全世界提供服务。”你必须在全球各地都建立推理设备集群,才能为全世界提供服务。这就是我对构建真正超大规模设备集群的理解。
顺便说一下,我还希望我的存储和计算资源也能靠近这些设备,因为不仅仅是AI加速器是无状态的,我的训练数据本身也需要存储,而且我希望能够复用多个训练任务。我希望能够创建这些环境,让agent可以在其中执行程序。这就是我的大致想法。
主持人:微软的财报显示每年AI中获得的收入达到130亿美元。基于同比增长,这一数字四年后将会达到1300亿美元。如果是这样,您将会如何利用这些工业规模的智能?这会通过Office(办公软件)来实现吗?还是说你会将其部署好后让其他人来托管?要拥有AGI才能实现1300亿美元的营收吗?实际情况到底会如何?
纳德拉:在我看来这是一个很好的问题,因为在某种程度上,如果你要实现这种爆炸式增长,我们首先要观察的就是GDP增长。在我讨论微软的收入情况之前,这一切有一个决定因素,就是我们对AGI的过度炒作。
发达国家吗(的GDP)增长率为2%,如果考虑到通货膨胀,增长率可能为0。因此在2025年,虽然我不是经济学家,但至少我认为我们正面临真正的增长挑战。因此,所有人要做的第一件事是,让我们实现工业革命式的增长。
对我来说,这意味着10%、7%,或者发达国家通货膨胀调整后的增长率达到5%,这是真正的指标。
很多人都在写这方面的文章,我很高兴他们这么做,也就是说,最大的赢家不会是科技公司。赢家将是使用这种商品的更广泛的行业。顺便说一句,这种商品非常丰富。生产力突然上升,经济增长速度加快,这种情况发生时,我们这个行业就会安然无恙。
但对我来说,这只是当下。我们自称取得了一些AGI里程碑,但在我看来,这只是无意义的基准测试。线%的速度增长。
主持人:如果世界经济增长率为10%,世界经济规模将达到100万亿美元左右,每年就相当于额外创造了10万亿美元价值。如果是这样的话,你作为超大规模企业……难道你不应该投资8000亿美元吗?如果你真的认为在几年内,我们真的可以按照这个速度发展世界经济,那么关键的瓶颈就是:你是否拥有部署这些AI来完成所有这些工作所需的计算能力?
纳德拉:没错。但顺便说一句,典型的供应方是,“嘿,让我建造它,他们就会来”。这是一个论点,毕竟我们已经做到了这一点,我们已经承担了足够的风险去做这件事。
主持人:我想知道这两种不同的观点是否存在矛盾,因为你做得非常出色的一件事就是做出这些早期的押注。你在2019年就投资了OpenAI ,当时Copilot和任何应用程序都还未出现。如果你回顾工业革命时期,当时铁路之类的基础设施建设投入占比达到6%、10% ,很多情况并不是说 “我们靠卖车票获得了收入,然后现在我们打算……”
如果你真的认为这里有潜力让世界增长率达到10倍或5倍,然后你会想:“那么,GPT-4的收入是多少?”如果你真的认为这是更高层次的可能性,难道你不应该说:“让我们疯狂起来,让我们进行数千亿美元的计算吧?”
纳德拉:这很有趣。这就是为什么即便是这种平衡的集群方法对我来说也非常重要。这是关于构建计算,它不仅可以帮助我训练下一个大模型,还可以服务于下一个大模型。除非你做到这两点,否则你将无法真正利用你的投资。
这不仅仅是一场建立模型的竞赛,而是一场创造一种商品的竞赛,这种商品将被世界用来驱动……你必须有一个完整的想法,而不仅仅是你正在思考的一件事。
过度建设。就像你提到的互联网泡沫时代发生的事情那样,现在已经有这样的信号了。你需要更多的能源,也需要更多的计算能力。所以,每个人都会竞相投入(发展)。
主持人:从消费者的使用场景来看,AI已经非常便宜了,大概是每百万个Token只需2美分,我觉得我真正受限于它能否变得更智能而非价格。但也许你在企业端看到的情况有所不同,到底是什么关键的AI使用场景,真的需要把价格降到每百万个Token 0.002美分呢?
纳德拉:我认为关键在于Token的效用,AI需要变得更好且更便宜。每当有像DeepSeek所取得的那种突破时,每个Token的性能效率前沿就会改变,这只会带来更多的需求,云计算领域就是这样的情况。
主持人:作为一个与财富500强企业合作,并且正在帮助他们为成百上千万甚至数十亿人部署产品的人,你认为这些能力的部署速度会有多快呢?即使你有了可用的agent、可以远程工作的工具,但考虑到所有的合规要求和固有的瓶颈,这些会成为很大的阻碍吗?还是说会很快克服这些问题?
纳德拉:这确实会是一个真正的挑战,因为真正的问题在于管理或流程变革。我常打的一个比方是,想象一下像我们这样的跨国公司在PC(个人电脑)、电子邮件和电子表格出现之前是如何做预测的,当时靠传真来传递信息。有人收到传真后,会写一份部门间的备忘录然后传阅,人们输入数据,最后可能刚好在新季度开始前得出预测结果。
主持人:精益生产所做的一件事是从物理层面上改变了工厂车间的样子,它揭示了一些人们直到真正关注流程和工作流程时才意识到的瓶颈。由于AI,你自己的工作流程发生了怎样的变化。当你拥有这些随着时间推移变得越来越智能的agent时,经营一家大公司会是什么样子?
纳德拉:这个问题很有意思。比如说,今天我们对电子邮件的依赖程度非常高。我早上来上班,就会想,天哪,我的收件箱都满了,我得回复邮件,所以我迫不及待地希望Copilot能自动帮我写好草稿,这样我就可以直接开始审核和发送了。
纳德拉:这对我们来说是一段长达30年的历程。太不可思议了。我是微软的第三任CEO,对量子领域一直很感兴趣。
马约拉纳零能模(Majorana zero modes),这一理论在20世纪30年代就被提出。
主持人:这太神奇了。谷歌、IBM也宣布了拥有100个物理量子比特,但你们的成果在可扩展性方面远超其他公司吗?
纳德拉:是的。我们还采取了一种方法,就是将软件和硬件分离开来。我们正在构建我们的软件栈,而且我们现在与研究中性原子、离子阱的团队合作,我们也在与其他在光子学等方面有很好方法的团队合作,这意味着会有不同类型的量子计算机。
主持人:太神奇了。100万个拓扑量子比特、数千个逻辑量子比特,达到这个规模的预计时间线是怎样的呢?这里有类似摩尔定律的规律吗?如果你已经有了第一个 “晶体管”(比喻关键突破),后续会怎样发展呢?
纳德拉:我们已经在这个领域努力了30年。我很高兴我们现在在物理学和制造技术方面都取得了突破。
主持人:那你认为在2027、2028年,当它能运行的时候,会是什么样的使用方式呢?是通过API来使用它吗?还是你们会在内部将其用于材料和化学方面的研究呢?
纳德拉:这是个很好的问题。有一件事我一直很兴奋,我们有量子项目,并为它添加了一些API。大概两年前我们取得的突破是将高性能计算(HPC)堆栈、AI堆栈和量子计算结合起来考虑。
主持人:你是如何做出研究决策的?这些决策在二三十年后会带来回报,尤其是在像微软这样规模的公司。显然,你对这个项目的技术细节非常了解。对于微软研究院所做的所有事情,你都能做到这样吗?还有你现在做出的这些在20年后会有回报的决策,是通过公司内部自然产生的吗?你是如何跟踪所有这些事情的呢?
纳德拉:我觉得很棒的一点是,大概在1995年比尔盖茨创办微软研究院时的理念。我认为在这些由好奇心驱动的研究机构漫长历史中,能创办一个专注于基础研究的研究机构,这是很了不起的。
要懂得如何接纳创新,并将其规模化发展”的文化。坦率地说,对于CEO和管理团队来说,这是很困难的部分,这也很有意思,这既需要良好的判断力,也需要良好的企业文化。
微软研究院有上千个项目,我们本应该大力推进,但却没有。我总是问自己为什么,原因是我们没有足够的信心,而且对于如何不仅接纳一项创新,还能将其转化为一个有用的产品,并构建出一个可以推向市场的商业模式,缺乏完整的思考。
主持人:你提到微软未来可能会有第六任(或者说接下来的三任)CEO,要是他们每个人都能让公司市值提升一个数量级,那么等到下一个重大突破出现的时候,微软的规模可能就会和世界经济差不多了。
主持人:让我们深入探讨一下你刚刚取得的另一个重大突破。令人惊讶的是,在游戏世界模型方面的这两个突破竟然在同一天出现。能给我讲讲相关情况吗?
纳德拉:我了解到,我们把它称作 “Muse”,它将会是一个关于世界行为或人类行为的模型。真的非常酷。你看,显然“DALLE” 和 “Sora” 在生成式模型上取得了令人难以置信的成就。所以我们想要追求的一件事是利用游戏玩法数据。
这是一个非常重大的时刻,就像我们第一次看到ChatGPT完成句子、DALLE画图或者Sora的表现一样,这是类似的一个具有里程碑意义的时刻。
主持人:是的。今天早上我只来得及和你们的首席研究员卡佳(Katya)一起看了一些实时演示视频。在和她交谈后,我才真正意识到这有多么不可思议,因为我们过去曾使用AI来对智能agent进行建模,而现在只是用同样的技术来对智能agent周围的世界进行建模,并实现了这种连贯的实时效果。这本身就非常不可思议。
通过你们的西班牙CEO,你们已经投入了数十、数百亿美元来发展微软的游戏业务并收购IP。回想起来,如果你能够将所有这些数据整合到一个大模型中,让你能够获得同时体验多个游戏世界的感受,而且如果这就是游戏发展的方向…… 似乎我们之前的投资是非常明智的。你之前有预见到这一点吗,还是只是一个巧合呢?
纳德拉:不,我是说,我们投资游戏业务并不是为了构建模型。坦率地说,我们公司的历史上有一件很有趣的事情。在开发Windows系统之前,我们就制作了第一款游戏。在我们甚至还没有开发Windows系统的时候,《飞行模拟器》就是微软的一款产品了。
我们投身游戏领域是因为我们热爱游戏本身。这就是为什么我总是说,我不喜欢那种把业务当作达到其他目的的手段的情况。这些业务本身就应该有其存在的价值。
我认为游戏数据也许就像YouTube对于谷歌一样,对微软来说具有重要意义。所以我对此感到很兴奋。
主持人:我刚才想说的是,有一种感觉是,你可以在许多不同类型的游戏中获得一种统一的体验。除了AI之外,这与微软过去在混合现实(MR)等方面所做的工作有什么契合之处呢?也许这能给小型游戏工作室一个机会来制作大型3A动作游戏,而且在未来五到十年内,你觉得会以哪些方式……
纳德拉:我一直把这三件事(AI、量子计算、混合现实)看作是基石,从某种有趣的角度来说,甚至在五六七年前,我就说过我们想要下的三个大赌注是AI、量子计算和混合现实。
主持人:当你写下一本书的时候,你得解释一下为什么这三个方面会在差不多的时间出现,对吧?因为本质上来说,你不会认为量子计算和AI就应该在2028年、2025年等时间出现。
主持人:让我们再回到AI线年的书中,你很早就对OpenAI进行了投资,在2017年甚至更早。你在书里说,“人们也许会说我们正在孕育一个新物种,一个其智能可能没有上限的物种”。当然,在2017年就谈论这个还为时尚早。到目前为止,我们一直以一种较为细致的方式谈论智能agent、Office Copilot以及资本支出(CapEx)等等。但现在让我们把视角放宽,思考一下你说过的这些话,并且想想,你作为超大规模云计算提供商,同时也在进行这些模型的研究,为构建一个新 “物种” 提供训练、推理研究,从宏观角度来看,你是怎么看待这个问题的呢?你认为在你担任CEO期间,我们会朝着超级人类智能的方向发展吗?
纳德拉:我想就连穆斯塔法(Mustafa,微软AI CEO)也用过这个词。实际上,他最近在谈论这个新 “物种” 时也用到了这个词。
最根本的一点是我们必须确保真正的信任,无论是在个人层面还是社会层面,这种信任是融入其中的。这是个难题。
制约其发展的最大因素将是我们的法律体系如何发展以应对这一情况。我们这里说的是所有的计算基础设施相关的法律体系。
主持人:是的。世界上有很多不同的社会,我想知道是否有某个社会的法律体系可能会更容易接受(AI的发展)。而且如果你无法实现AI的 “takeoff”,那么你可能会担心。它不一定非要在美国实现,对吧?
纳德拉:是的,这是好的。但可以说,即使在任何一个社会中,我们都认为没有哪个社会会不在乎这个问题。世界不会坐视不管并说我们会容忍这种情况。因此,这就是为什么我很高兴我们有一个世界秩序,在这个秩序下,任何不法分子都会受到相应的惩罚。
主持人:但如果你设想会出现10%的经济增长,我认为这取决于人机交互(HCI)之类的技术能够发挥作用,因为数万亿美元的价值,这听起来与人类工资在60万亿美元经济总量中的占比相当。要达到那样的规模,你几乎必须以非常重要的方式实现劳动力自动化或对劳动力进行补充。如果这是可能的,并且一旦我们弄清楚了其中的法律影响,那么在你的任期内,我们解决这些问题似乎也是相当有可能的。你有考虑过超级人类智能吗,比如你职业生涯中最大的成就可能就是实现这个目标?
纳德拉:是的。顺便说一下,你又提到了另一个问题。我知道大卫・奥托(David Autor)等人对此谈论了很多,那就是60%的劳动力。我认为另一个需要探讨的问题是,至少让我们谈谈我们的民主社会。
为了拥有一个稳定的社会结构并使民主制度正常运转,不能只让资本有回报而劳动力没有回报。你可以讨论这个问题,但那60%的劳动力必须得到重新评估。
主持人:在一致性方面,两年前,你们推出了“Sydney”(Bing的一个版本)。需要明确的是,考虑到当时的技术能力水平,我认为它是一个有趣、可爱但又有点搞笑的不一致的例子。当时的聊天机器人,可以思考30秒然后给你一些有趣或不恰当的回复。但如果想想那类系统,比如它曾试图让《纽约时报》的一名记者离开他的妻子之类的,如果你考虑到未来的情况,并且有这些智能agent,它们可能会在数小时、数周、数月的时间里,就像一群自主AGI一样,可能会以类似的方式出现不一致的情况并把事情搞砸,甚至可能会相互协作。那么对于未来,当你拥有更强大的AI时,你有什么计划来确保它是正确运行的呢?
纳德拉:没错。这就是为什么我认为当我们分配计算资源时,我们应该为解决一致性挑战分配计算资源。更重要的是,在什么样的运行时环境中你才能真正能够监控这些东西呢?
主持人:当你真正拥有能够为你完成数周任务的智能agent时,在你允许任意一家财富500强企业使用之前,你希望得到的最低保证是什么呢?
纳德拉:我认为当我使用像深度研究(Deep Research)这样的东西时,我认为我们希望得到的最低保证是,尤其是在任何东西有实体体现之前(确保其安全性等)。我认为这是一个需要跨越的门槛。所以这可能是一个方面。
主持人:除了安全问题之外,当你考虑自己的产品套件时,并且想想如果有一天你拥有了如此强大的AI,它不仅仅像Copilot那样,在你提到的为这次播客做准备的例子中,它更像是你实际将工作委托给同事的方式。考虑到你目前的产品套件,将这种强大的AI融入其中会是什么样子呢?有一个问题是大语言模型是否会被其他东西商品化。我想知道像数据库、画布(Canva)或Excel表格之类的东西,如果大语言模型是你访问所有这些的主要入口,那么大语言模型有没有可能让Office商品化呢?
纳德拉:这是有可能的,这是个有趣的问题。我认为至少在第一阶段,我是这样考虑的,大语言模型能否帮助我更有效地使用所有这些工具或画布来完成我的知识工作呢?
如今存在的软件即服务(SaaS)应用程序,这些增删改查(CRUD)应用将从根本上发生改变,因为业务逻辑将更多地进入这个智能agent层级。
实际上,我使用Copilot时的另一个很酷的体验是,当我说 “嘿,我要准备和客户开会了”,我只要说 “给我所有我应该知道的会议相关笔记”。它会从我的客户关系管理(CRM)数据库中提取信息,从我的Microsoft Graph中提取信息,基本上创建一个综合的成果。这意味着它甚至会对这些信息应用逻辑。
主持人:SaaS作为一个行业,每年价值可能高达数千亿甚至数万亿美元,取决于你如何计算。如果真的能够被AI重塑,这会是在未来十年内让微软市值再增长10倍的下一步吗?因为如果你真的在谈论数万亿美元的市场……
纳德拉:我认为这也会创造很多价值。在SaaS领域,要记住,一个很大的问题是,也许我们没有足够重视的一件事是全球存在的信息技术(IT)积压工作量。
主持人:可以问一些关于你在微软工作的问题吗? 做一个 “公司人”(company man,指长期在一家公司工作、对公司忠诚度高的人)是否被低估了呢?你职业生涯的大部分时间都在微软度过。你能够为公司增加这么多价值的一个原因可能是,你见证了公司的文化、历史和技术,并且通过晋升获得了所有这些背景知识。更多的公司是否应该由具有这种背景知识的人来管理呢?
纳德拉:这是个很棒的问题。我之前没有从这个角度想过。我在微软已经工作了34年,基本上每年我都对在微软工作感到更加兴奋,而不是想着 “哦,我是一个公司人” 之类的。
主持人:你作为微软CEO,现在正在做些什么来留住未来的 “萨蒂亚・纳德拉”,以便他们有机会成为像你这样的领导者呢?
纳德拉:这很有意思。今年是微软成立50周年,我对此思考了很多。我认为,长寿不是目标,保持相关性才是目标。
我们正在做的事情对于我们所看到的不断发展的世界来说,是否有用且相关,不仅仅是对今天,更是对明天。
主持人:说到这里,你刚刚提到微软距离成立50周年还有两个月。如果你看看按市值排名的前10家公司或者前5家公司(取决于你是否把沙特阿美计算在内),基本上除了微软之外,其他公司都比微软年轻。这是一个很有趣的现象,为什么最成功的公司往往都很年轻呢?财富500强公司的平均寿命是10到15年。微软做了什么,才能在这么多年里一直保持相关性呢?你是如何不断 “重新创立” 公司的呢?
纳德拉:我很喜欢里德・霍夫曼(Reid Hoffman)用的这个词,我喜欢 “重新创业” 这个概念。我认为这是一种思维方式。人们谈论 “创始人模式”,而对于我们这些普通的CEO和其他人来说,更像是 “重新创业模式”。
主持人:我不确定从你对不同问题的回答中能否判断出,你是否认为AGI会成为现实,是否会出现一种能够自动化所有事情的东西,至少从所有认知劳动开始,就像任何人在电脑上能做的任何事情那样?
纳德拉:你看,这就是我对人们谈论它的定义方式存在疑问的地方,认知劳动不是一个固定不变的东西。就像现在存在认知劳动,如果我有一个收件箱来管理我所有的智能agent,这算不算是新的认知劳动呢?所以今天的认知劳动可能会被自动化。
纳德拉:有可能,但一旦它做到了第二点,就会出现第三点。所以这就是为什么我认为,我们在历史上已经经历过工具的变革改变了认知劳动的情况,为什么我们还担心所有的认知劳动都会消失呢?
主持人:我相信你以前也听过这样的例子,就像马在某些方面仍然有用,有些地形你开车去不了,但你也不会看到满大街都是马,也不会有数百万匹马被用来工作,这种情况不会发生。那么对于人类来说,类似的事情会发生吗?
纳德拉:但从一个非常狭窄的角度来看,在人类历史上,我们仅仅在过去的200年里,才把我们所理解的某些狭窄的 “认知劳动” 视为有价值的东西。
主持人:你能想象在微软董事会中添加一个AI成员吗?它有没有可能具备那种判断力、背景知识和全面的理解能力,从而成为一个有用的顾问呢?
纳德拉:这是个很好的例子。我们在Teams中添加了一个会议主持人智能agent。在初期,它的目标是,这个具有长期记忆的主持人智能agent,不仅仅是关于会议的背景信息,还包括我正在处理的项目以及团队等方面的背景信息。
主持人:说到材料和化学方面的事情,我记得你最近说过,你希望在未来25年内实现这些领域在过去250年里的发展进步。当我想到未来250年可能实现的事情时,我想到的是太空旅行、太空电梯、永生以及治愈所有疾病。而你认为未来25年就能实现吗?
纳德拉:我提出这个想法的一个原因是,我喜欢这样一种观点,你看,工业革命,如果说是持续了250年,如果你把从基于碳的系统到其他系统的整个变革过程考虑在内,那么这意味着你必须从根本上重新发明过去250年里化学领域所发生的一切。