PokerStars扑克官网

拆掉Token暴利墙,云厂商下场造芯 | 企服国际观察

图片起源@unsplash

作者:刘翠枝
颁布功夫:2026-05-29 05:12:27
阅读量:6963

拆掉Token暴利墙,云厂商下场造芯 | 企服国际观察

图片起源@unsplash

一家云推算厂商是否选择自研芯片,还是底第三方的产品技术,能够从产业链分工的角度去思虑这个问题。企业越靠近上游,越必要出格大的规模效应,对技术的整合能力、需要的共性把握要求会更高,例如做GPU的英伟达、CPU的英特尔,就是处于上游地位,云推算厂商通常是很难撬动这样的市场。但若是这个领域产生变动,就可能产生新的机遇,这个机遇可能让云推算厂商在竞争中产生一些阶段性的优势,或者对内业务可能提供更高的性价比,这就值得云推算厂商去加大投入去做。

如今,这个变动叫做Agent发作驱动下的大模型训练和推理需要增长,这个投入的机遇则是自研芯片蕴含不限于AI推理/训练、X86等规划。事实上,全球头部云厂商不谋而合地加快了自研芯片的措施。

代替英伟达?自研芯片进入贸易化阶段

在笔者看来,海表云厂商的自研芯片大体经历了三个阶段。

第一阶段是为自身业务降本,例如AWS早期推动的Graviton,主题指标是提高云内部效能;第二阶段是抢夺市场话语权,随着x86芯片起头规;坎,并在云基础设施中占主导职位,芯片起头成为云厂商吸引客户、界说架构的沉要工具;第三阶段是当芯片具备自我造血能力后,萦绕AI需要沉构基础设施,沉点是通过多样化芯片供给,削减对单一供给商的依赖,把推理和训练产生的利润更多把握在自己手中。而AWS、微软云、谷歌云的自研芯片蹊径也就此正式分化:

公开信息显示,AWS已将Trainium和Graviton作为主题自研芯片产品,别离覆盖AI训练、推理及通用云推算厂商。据安迪·贾西在今年4月披露的信息中,其芯片业务正持续扩张,并成为云业务的沉要组成部门,其中,Trainium3比上一代效力提升4倍、能耗降低40%,AI训练与推理成本最多可削减50%。 谷歌云的自研张量处置器TPU一向是AI芯片领域的标杆,尤其最近谷歌云颁发向其客户销售TPU反映出市场对其芯片的强烈需要。Google Cloud Next大会上,谷歌云将第八代TPU拆分为两款独立芯片——TPU 8t(训练)和TPU 8i(推理),这体现出其对AI工作负载分工的判断。谷歌云宣称,TPU 8t的训练性价比力上一代提升约2.7倍,TPU 8i的推理性价比提升80%。 微软方面,更左袒于推力侧优化。今年1月,微软颁布第二代AI芯片Maia 200,用于Azure AI和Copilot有关推理业务,其机能对标谷歌第七代TPU。为了实现机造推理效力,微软进行了一个关键性设计弃取,仅原生支持低精度推算(FP8/FP6/FP4),并基于尺度以太网的新型双层可扩大网络设计,不依赖于专有网络架构。目前Maia 200优势在于与其Azure云服务生态、OpenAI前端业务深度绑定,以及Microsoft 365、Teams等海量用户场景,以提升芯片设计优势。

整体来看,AWS采取的是训推一体思路,强挪用Trainium、Graviton等芯片组合覆盖从训练到推理的业务场景;谷歌最新的动态则批注其更偏差于训练和推理解耦,第八代TPU已经分工明确;微软聚焦推理侧,Maia 200的定位就是支持Azure AI和Copilot蹬爪用场景中的低成本、高效能推理需要。

这种分化反映出三家公司对AI产业阶段的分歧判断:AWS更强调全栈节造和规模效应,谷歌更看沉专用化带来的机能和效能,微软则将沉点放在企业级推理需要和利用入口上。不外,AWS目前明确暗示并不试图代替英伟达,例如其Trainium4支持英伟达NVLink Fusion,而谷歌和微软则更偏差于与英伟达发展竞争。

而究其自研芯片能企业推理成本降低几多?以及在多大水平上能造衡英伟达的定价权?

市场反映已经给出部门答案。

AWS官方披露,Trainium2全面售罄,Trainium3靠近满订,Trainium4提前一年半被预约大半?突Р忝,Anthropic已颁发承诺向AWS定造芯片投入高达1000亿美元,而Meta也于近日与AWS达成在Graviton采购用于AI推理场景的合作。

去年底,钻研机构SemiAnalysis颁布汇报指出,从总体占有成本(TCO)角度看,谷歌第七代TPU芯片在成本效能上对英伟达组成显著优势。并且受竞争压力,OpenAI已从英伟达获得约30%的算力报价折扣。近期,黑石集团颁发与谷歌成立的美国合伙公司,向客户提供数据中心容量、网络、运维以及Google Cloud TPU的compute-as-a-service服务,能够理解为新GPU云入口。表界以为,此举将与CoreWeave、Crusoe这样的新兴GPU云厂商发展正面竞争。

扩大本钱开支,云厂商的一本经济账

目前来看,云厂商的角色已经变动,不再是单纯的算力出租方。从前传统云推算时期重要依附虚构化和资源调度获取收益,而AI业务也更多依赖租赁GPU实现AI服务扩张,如今AI时期的需要更集钟注更沉资产,芯片、网络和软件栈的一体化设政战术也可能更容易地将AI算力利润留在平台。

也能够理解这一变动是为拆掉“Token暴利墙”:一壁是上游芯片厂商凭借供给稀缺性占有较强定价能力,另一壁是大量AI利用企业因推理成本不休推高而承压。尤其在视频天生、Agent、多轮对话、编程等高算力亏损场景中,单元Token的成本已经成为影响贸易化速度的关键变量。

云厂商加码自研AI芯片还有一个现实布景:AI需要已经大到不齐全适合传统租云模式。头部大模型公司和AI利用企业起头更器沉自建或半托管AI基础设施,而中型体量客户则但愿获得更便宜、更不变、更易规;腁I算力供给。在这种情况下,云厂商若是不能提供更具性价比的规划,就可能在未来的AI基建的竞争中被边缘化。

AWS、微软云、谷歌云与OpenAI、Meta、xAI等头部大模型企业的关系,也不再是单一的算力采购,而上升为基础设施协同和生态绑定。这类合作一方面援手云厂商验证自研芯片和基础设施规划的可行性,例如AWS与Meta的合作,微软此前与OpenAI的深度绑定,以及谷歌与Anthropic的合作。

云厂商近年来频仍扩张AI有关本钱开支。亚马逊在2026年一季度本钱开支达到432亿美元,并将整年本钱开支指引上调至约2000亿美元;Alphabet将2026年本钱开支指引提高至1800亿至1900亿美元;微软同样维持高强度投资,2026财年本钱开支指引约为1900亿美元。

市场普遍以为,这轮投入短期内不定直接改善利润,但有助于云厂商降低单元推理成本,并加强客户黏性。财政上能否回本,取决于三类成分:一是单元推理成本是否降落,二是客户是否因而扩大使用规模,三是云厂商能否吧自研芯片与大模型托管包装成为更强的贸易模式。

当然,芯片自身不定对于云厂商是利润中心,但它可能决定云服务的利润上限。尤其在高算力亏损场景中,Token价值一功夫不成能打下来。

值得关注的是,国内云厂商目前也在加快自研芯片和数据中心等有关布局。公开信息显示,阿里已推动在最新万卡集群数据中心中使用自研AI芯片“真武”;华为昇腾950系列AI芯片因国内AI订单需要大幅提升,打算2026年出产约75颗950PR芯片;腾讯则打算用792亿元重要用于AI基础设施投入,索求提升算力利用效能。

同样是GPU芯片紧缺布景下,相比海表云厂商,国内蹊径更强调供给链可控、软硬件协同以及行业落地能力。这种模式目前尚未能以单点芯片竞争为指标,而是通过Scale-out互联将单集群规模推高至万卡以上,两者叠加从而构建超万卡集群的大算力底座,这种奇妙的变通规划,只管会带来肯定现实挑战,但已经吸引到了不少国内企业客户。

当然,云厂商下场造芯这件事件不是从今天才起头的,短期内,英伟达在GPU芯片市场的主导职位依然难以被迅速撼动。从前十年,散布式云推算构建经典的“削峰填谷”和“资源池化”,以更好地实现云服务的弹性调度。大模型场景下,算力必要大规模集中式训练,服务器也无法被切分成单个虚机,云厂商再也无法通过超卖获得超额的利润回报。

从这个角度看,云厂商起头更多地精力投入在自研造芯这件事件上,争的是未来对AI市场的定价权,谁能更有效地压低Token成本,谁就更有机遇把AI造成一门可持续的生意。

(作者 | 杨丽,编纂 | 杨林)

 

文章点评

未查问到任何数据!

颁发评论

◎欢迎参加会商,请在这里颁发您的见解、互换您的概想。

最新文章

热点文章

随机推荐

【网站地图】