手机whatsapp下不了图片
ChatGPT的横空出世点燃了科技巨头之间的Al军备竞赛战火,微软、谷歌、亚马逊、Meta等海外科技巨头都在进入战略布局加速阶段:由 OpenAl推动的生成式Al商战第一回合,让它和微软都成了赢家;而原本更早投入Al的 Google、亚马逊(Amazon) 和 Meta,在此前第一回合的商业化速度不及预期,目前正全力冲刺并反追第二回合。
世界正陷入一场疯狂投资、GPU 采购和AI人才的争夺战,海外巨头们在第二回合的出招策略各自是什么?分别在哪些领域发力?战略重心和考量要素有哪些?四分仪整理了海外财经最新动态,通过本篇为读者详细盘点。
去年开始,“生成式Al浪潮”席卷而来,造浪者是OpenAl,在2022年11月30日推出杀手级应用 ChatGPT后,其营业额从2022年的2亿美元飙涨到2023年的16亿美元,1年成长了700%,估值达到900 亿美元。ChatGPT的出现让人们意识到Al技术的潜力,也点燃了科技巨头之间的Al军备竞赛战火。微软、谷歌、亚马逊、Meta等海外科技巨头, Al策略布局动向都进入加速阶段。
5月27日,马斯克再次点燃战火,其旗下的大模型创企xAI官宣拿到60亿美元(折合约435亿人民币)B轮融资,估值达到约180亿美元(折合约1304亿人民币)。据The Information今日报道,马斯克在本月的投资者演讲中表示,xAI 将需要多达 10 万个专用芯片来训练、运行下一版本的对话式 AI 聊天机器人 Grok。
从技术开头演变为商战接手,由 OpenAl推动的生成式Al 商战第一回合,让它和微软都成了赢家。原本更早投入研究Al的 Google、亚马逊(Amazon) 和 Meta,在商业化的速度和成绩落后,正全力调整打算在第二回合追上。
世界正陷入一场疯狂投资、GPU采购和人才争夺战,生成式AI已进入以商战为核心的 2.0 时代,巨头们在第二回合的出招策略是什么?它们分别在哪些领域发力?海外科技巨头在AI发展层面重点考虑的因素有哪些?
谷歌将旗下的人工智能研究部门 Brain 与 DeepMind 合件,并在去年底推出原生多模态的Al模型 Gemini,想要后来居上;亚马逊除了研发自家模型,也投资40亿美元在开发语言模型的新创公司Anthropic身上,类似微软投资OpenAl,并通过打造模型云平台 Bedrock,提供企业客户多种Al 底层语言模型使用;Meta手上暂时没有好牌,干脆走开源策略,试图集众人之力,让旗下的大型语言模型 Llama 成长为另一个体系标准。
垫高技术门槛,是各家巨头的共同选择。“企业需要拥有大型语言模型,有实时、庞大的数据量,同时要有足够的 GPU 算力,才有资格继续参赛”,谷歌台湾前董事总经理简立峰指出,在过去一年间,可以看见几家科技巨头出手AI技术布局。
首先,针对自然语言处理(NLP)的技术竞争会更加激烈。OpenAl 推出最新迭代版GPT,比GPT-4的能力大幅提升,反应极快还“通人性”;另一方面,谷歌的Gemini Ultra功能也持续迭代,号称要打败GPT-4,从而稳住市场信心,避免彼此之间的差距逐渐拉大。
生成式Al崛起1年多来,几乎和“模型战争”画上等号,巨头争相发表大型语言模型,强调参数量、训练强度、能在标准测试中达到的成绩作为军火展示。
支撑模型运作的算力资源,也是关键。调动外部服务的成本会日益攀升,所以目前可以看到到各家大厂除了向英伟达下订单,也都积极投入自研芯片,希望打造出更贴近自家企业需求的 Al芯片。Gemini 正是采用自研芯片TPU,0penAl执行长山姆·奥特曼 (Sam Altman) 也 投资了一家Al芯片公司 Rain Al。
对亚马逊来说,长久投入的自研芯片也在成本、算力上具有优势。亚马逊从2013年就开始自研芯片,中间还“开外挂”收购色列芯片公司 Annapurna Labs,目前在亚马逊、微软和谷歌这3家云端巨头之中,亚马逊是少数坐拥 4种类型客制化芯片——标准计算芯片、训练专用芯片、推理专用芯片及服务器芯片的云端提供商。
不过对手也都在加紧投入自研芯片,微软于去年推出芯片 Maia 100 和云端服务器处理器 Colbert 100应战。谷歌早在2018年研发自己的Al芯片—— Edge TPU,体积小于1美分硬币铜板,至今已经更新至第5代。相较 GPU 通用芯片,TPU 芯片的功耗较低、延迟性较低,运算效率较高,能够在边缘装置上执行机器学习推论。2家目前都有传出新芯片研发中的计划,预计最快在2025年登场。
不仅如此,数据的“质”与“量”同样是影响企业训练模型的关键。为了全面应战,谷歌将Al聊天机器人 Bard 导入搜寻引擎,并将Al 功能整合进 Meet 视讯会议、云端储存空间、Google Docs,谷歌正尝试把 Al 部署到不同通路,通过发布小型语言模型 Gemini Nano,将模型部署到终端应用(即 Pixel手机),实现边缘运算,从整个生态系赢回一局。
马斯克于2023年7月成立的xAI,自2023年11月推出聊天机器人Grok以来,一直在追赶OpenAI的步伐,至今已接连官宣多项重要进展。今年3月,马斯克宣布开源3140亿参数的混合专家模型Grok-1,3月底推出128k长文本Grok-1.5,4月推出首款多模态大模型Grok-1.5V。投资者认为,X相当于一个数据源,可用于训练支持聊天机器人Grok等产品的大型语言模型。
不断垫高技术舆资源门槛的同时,巨头间的第二回合更看重谁能从生成式Al技术获利,所有人都在摸索合适的商业模式与应用场景。据彭博行业研究发布的研究报告预测,到2032年,生成式AI有望创造1.3万亿美元(约9.3万亿人民币)的收入,将为应用软件行业带来2800亿美元的新增软件销售。
谷歌聚焦企业端应用、开发者与智慧手机生态系,亚马逊将Al应用于企业云端场域,而Meta则专注于社群网站,透过Al投放更精准的广告……对于微软、谷歌等超大型企业而言,挑战在于找到第二增长曲线。
在生成式Al 大战第二回合中,云端服务是另一个战场。随着Al的普及性提高,越来越多企业希望在既有的大型语言模型基础上,透过 fine-tuning (微调)模式训练出专属的ChatGPT,特别以欧美地区的数字经济企业最感兴趣,目标是提高内容生成效率,降低客服和营销人员成本。
在可预期的未来,几家公有云业者有机会迎来新一波的收入。根据美国 Geekwire 网站报道,微软执行长萨蒂亚·纳德拉 (Satya Nadella) 在2023财年第4季度财报电话会议上表示,Azure云端营收成长达到29%,其中约有3个百分点来自人工智能;亚马逊执行长安迪·贾西 (Andy Jassy) 也表示,Al将在未来几年内为 AWS 带来数百亿美元的收入。根据研调机构 Synergy Research Group 最新数据,亚马逊的 AWS 居冠,目前市占约32%,微软的Azure 居次占23%,再来是 Gooqle Cloud 占11 % 。
除了上述前3名的争夺 ,Meta率领的开源阵营也在虎视眈眈。Meta不得不走开源路线,是因为其手上没有任何生产力工具,也不是云端服务业者。最聪明的作法就是跟大家一起创造双赢,甚至最后能够把应用成果拉回自己的社群媒体平台上。
那么在生成式Al 第二回合大战里,各家科技巨头都在如何进行战略布局?四分仪智库详细梳理总结了微软、谷歌、亚马逊、OpenAl、Meta的布局方向。
微软加大力度与OpenAl 合作,研发更准确、自然的大型语言模型(LLM),并在短短几个月内透过整合生成式Al技术,提升微软原有产品的竞争力,比如在 Microsoft 365 系列应用程序中导入聊天机器人 Copilot。公司2023年底推出Copilot for Microsoft 365企业版, 将Copilot导入 Microsoft 365 应用程序中,包含Word、Excel、PowerPoint、Outlook、Teams 等协助企业用户的工具。不只针对企业端,微软还加码推出Copilot Pro,允许每一名个人用户都能订阅Copilot 服务。
澳洲的变格理银行集团(Macquarie Group Limited)预测,假设累计5%的初始使用率(相当于 2000万名企业用户),截至2025 财政年度结束时,微软有机会从 Microsoft 365 Copilot产生大约73亿美元的年度经常性收入。美国投资银行派杰投资(Piper Sandler)则直接把Microsoft 365 Copilot 比喻为“微软的iPhone时刻”,预测这波生成式Al 浪潮可能会为微软带来超过破千亿美元的商机。
一是针对全世界正在关注的新产品型态Al PC, 把 Al功能整合进个人计算机,陆续在 Windows 11计算机键盘上加入新按键Copilot,展现要把Al无缝融入Windows 作业系统的决心。不仅如此,微软研究院一直很积极研发小型语言模型 (SLM),将语言模型调整至足够小的尺寸,以便它们可以在没有联网的情况下,放入计算机、手机等终端产品运作,自动筛选和优先处理脸书、Messenger、WhatsApp 及微信的讯息,还可针对计算机上的其他任务提出个人化建议。
二是透过提供Azure OpenAl模型(指拥有ChatGPT的云端服务) ,与各种高附加价值的企业客户建立合作关系。微软目前正与跨国管理咨询公司埃森哲合作,协助企业用户快速上手 GitHub Copilo应用。
虽然在生成式AI第一回合中,谷歌推模型、推Al的速度较慢,市场甚至一度怀疑谷歌陷入创新者困境。但从去年底推出Gemini来看,第二回合中,谷歌要从整个生态系赢回来。
面对微软与OpenAl联军来势汹汹,谷歌的秘密武器就是 DeepMind。2023年4月,谷歌将旗下2个主要的人工智能研究部门—Google Brain与DeepMind合并,命名Google DeepMind 事业群,集中所有Al研发资源打反攻战。谷歌在去年底推出的多模态 Al模型 Gemini,能够理解与推理文字、程序码手机whatsapp下不了图片、声音、图片、影音等不同类型的信息,正是 GoogleDeepMind 的重磅作品。
DeepMind的优势是,在自家设计的TPU芯片上训练模型,而不是与业界其他公司争夺高价稀缺的GPU资源。TPU 芯片训练大型语言模型的速度不断提高,对于在 Gemini 前沿模型上的开展研究至关重要,也会让 Al 聊天机器人 Bard 将变得更有效率地完成推理任务,终端设备的应用也会变得更加自动化。技术上的独到之处,让市场普遍预计 Gemini 模型最终会被嵌入谷歌的搜寻引擎、广告以及 Chrome 浏览器,藉此提升核心业务竞争力。
虽然综合以上条件,谷歌成功重返市场主导地位的竞争行列。但有关谷歌 DeepMind 的获利策略尚未公开,目前看来依然是亏损状态。DeepMind 的自我定位一直是研究中心,而不是企业,这使得它的商业模式和收入来源并不清晰,导致谷歌高层和 DeepMind 核心团队始终无法形成共识,对吸引和留住人才存在风险。
谈起生成式Al,微软、谷歌和 Meta 通常被认为是第一梯队。亚马逊似乎步调较缓,2023年4月才推出首款大型语言模型 Titan、Al平台 Bedrock, 同年6月宣布投入1亿美元设立生成式Al创新中心。直到2023年末,亚马逊才正式发表一款面向企业客户的聊天机器人Amazon Q。
2023年11月底,亚马逊旗下云端公司 AWS一口气发布数十项生成式 Al产品,正式揭露亚马逊的 Al战略。AWS 是亚马逊在生成式Al 的第一张王牌。AWS 全力投入的战场是——企业用户和开发者。其聊天机器人Amazon Q,专门锁定企业应用,作为公司的专属助手,让企业在安全环境中把资料给模型做训练,了解公司运行的所有项目内容、财务计划、分工流程后,为企业客户提供程序码建议、协助找资料、帮忙制作图表报告等日常工作。
但锁定企业这条路上,亚马逊最大敌人就是微软,尤其 Microsoft 365 软件渗透率超过70%,成为工作者生活中不可或缺的一部分。AWS 生成式 Al副总裁瓦西·菲洛敏 (Vasi Philomin)回应:“企业真正的痛点并不在文件处理、邮件收发这些工作上,而是在网站维通、应用程序新功能开发、顾客沟通等领域,这正是我们锁定的需求。AWS 希望一举打进系统维运等企业最核心的根基,也会更有机会提高客户的黏着度。”
数百万的AWS 客户预计会持续留在亚马逊麾下使用Al 产品,因为长期在 AWS 平台上运行应用程序、储存数据,IT人员也非常熟悉使用方法,这都是加速 Al发展的重要因素。亚马逊能否靠着企业客户的策略,快速滚动生成式Al商业模式,将成为它急起直追的关键任务。
OpenAl是微软的重要盟友,负责研究大型语言模型(LLM) 技术,每周有超过1亿用户使用,超过200万名开发者通过API( 应用程序设计界面))将NLP(自然语言处理)功能整合到他们的应用。据The Information报道,OpenAl 在2023年的营收达到16亿美元,比前1年成长7倍,更有机会在2024年突破50亿美元。
OpenAl的营收成长主要来自2处:一是2023年推出的付费版本ChatGPTlus, 向每位订阅用户收取20美元;二是针对开发人员提供API,允许任何企业将ChatGPT技术导回自家的网站或产品,这部分收费细节虽然还未披露,但可能是主要收入。
以参数量预训练的资料量来看,OpenAl 手上的新一代大型语言模型实力领先,回答准确度、连贯性更高。另外,OpenAl 的GPT Store应用程序商店,功能类似 Google Play 商店和苹果 App Store, 允许ChatGPT Plus及 ChatGPT 企业用户在上方自制 Al 工具,并提供其他用户下载使用。《The Verge》评论, 该商店会帮 OpenAl 带来更多潜在用户,进而拓宽整个生态圈。
但OpenAl与微软市场有很大部分重叠,两者的潜在冲突可能会升高。美国艾伦人工智能研究所共同创办人奥伦·埃齐奥尼 (Oren Etzioni) 指出,2家公司目前都会向企业客户出售0penAl 技术的使用权,微软将其纳入旗下Azure云端服务的一部分,0penAl则是直接向客户销售Al 模型权限,双方在业务拓展路线上是重复的,导致经常互抢客户。
尤其在一场戏剧性的人事风波后,OpenAl 的自主权与内部管理能力始终被打上问号。此外,GPT Store 衍生的潜在安全问题,也是0penAl 团队的痛。GPT Store允许各种外部软件应用跑在 OpenAl 的模型上,需要承担资料交换、金流交易等风险,假设之后出现黑客攻击事件,0penAl将责无旁货 。
Al已经取代元宇宙,成为Meta倾注全部心力的发展领域。过去一年,Meta在Al领域可谓动作频频先是端出大型语言模型 Llama, 而后更陆续发表多款支援语音、影像编辑的Al 模型与工具,同时在 Al基础设施方面大举扩充实力,包括发表自研Al晶片MTIA、打造针对 Al 研究的超级计算机,并且采买多达15万张英伟达 H100 GPU,与微软并列年度最大买家,这个数字甚至是谷歌的 3 倍 。
为了追上微软、OpenAl、谷歌egug等领跑者的脚步,Meta 进军生成式Al的策略非常鲜明:开源。Meta 致力于开源已有相当长的历史,机器学习程序库PyTorch就是由Meta的 Al团队开发,并交由Linux基金会管理的开源项目,开源是他们的拿手好戏。
扎克伯格认为,结合全球开发人员的力量,可大幅提升改善Llama2的效率,进而减少研发Al的庞大成本。而 Meta 的开源策略也成功吸引大量开发人员买单,去年12月发布的新闻就提到,Llama模型的下载量已超过1亿次建立模型,但该如何利用Al变现,仍是Meta在探索的方向。
另外,Meta携手IBM 成立Al联盟,主张秉持开源、开放的方式发展Al技术,吸引如戴尔、索尼、超微及英特尔等多家企业加入。有看法认为,Meta 希望以开源形式集结整个Al 生态中不同位置的厂商,在过程中寻觅出额外的商业可能性。日前Meta主要将Al应用在老本行——社群平台及广告上,他们为用户、企业、提供了各种便利发布的工具,还推出聊天机器人MetaAl,想借此增加对年轻族群的吸引力,同时这也是推播广告、连结企业与消费者的全新桥梁。
“未来会是一个百家争鸣的时代,我们不太可能只依赖某一家大厂的Al服务。”台大电机工程学系教授李宏毅认为,这是生成式Al的发展趋势,随着技术成熟、消费者需求多元以及市场竞争加剧,各家公司都会试图寻找自己的目标受众,在不同的细分市场进行差异化经营 。
但无论如何,AI塑造新世界的过程中,将会有无数令人惊艳的新技术、新产业和新商业模式。世界著名科技杂志《连线》主编凯文·凯利预测说:“在5000天后,我们将迎来崭新的巨大平台──万物与AI互联,数字化完美融合在现实世界中,新的科技引领未来,大数据、增强现实、虚拟现实、在线D建模等汇聚成一个相互连贯的数字孪生系统,从而使镜像世界成为未来世界的第三大平台(第一是互联网、第二是社交媒体)”。