欢迎访问江南电竞入口安卓版

告别“幕后”时代:Arm首款自研芯片问世,直击x86核心领地

2026-03-31 来源:电子工程专辑
100

关键词: Arm AGI CPU 代理式AI 算力架构

35年来,英国芯片巨头Arm一直在半导体行业内扮演着“只卖IP,不造芯片”的角色,是苹果、Meta、亚马逊身后的隐形巨人。然而,这家由软银(SoftBank)控股的科技巨头,在日前正式宣布推出其首款量产通用处理器——Arm AGI CPU。

这一战略转型的背后,是人工智能(AI)计算需求发生的结构性巨变。随着“代理式AI(Agentic AI)”——能够自主执行复杂任务的软件智能体——成为硅谷的新宠,传统的算力架构正面临前所未有的压力。

“AI从根本上重塑了计算的构建与部署,代理式计算正进一步加速这一变革。”Arm首席执行官Rene Haas表示,Arm AGI CPU芯片的推出,标志着Arm计算平台迈入全新发展阶段,也成为公司发展的重要里程碑。

代理式AI正在重塑AI基础设施

之所以选择将代理式AI基础设施作为首款自研CPU的核心发力方向,Rene Haas的看法是,代理式AI不仅要求部署更多CPU、实现极大的规模化扩展与极致的性能,还让数据中心面临着巨大的功耗压力。这三大需求叠加,让市场出现了明显的供给缺口,该领域的服务能力亟待补齐。

“其实在Arm与Meta展开合作之初,这一市场的需求远未得到充分满足。如今回头看,用‘需求未被充分满足’来形容,都算轻描淡写。” Rene Haas认为这一市场蕴藏着极其巨大的机遇,足以容纳众多参与者,“我们不是在抢夺存量市场,而是在填补巨大的供给缺口。”

IDC等研究机构数据显示,全球服务器市场在AI基础设施投资的强劲驱动下创下历史新高。全年服务器市场规模达到4441亿美元,同比大幅增长80.4%。其中,x86服务器仍占据市场主导地位,全年营收规模约为2839亿美元,同比增长39.9%;非x86服务器(主要为Arm架构)增长更为迅猛,同比增幅达63.7%,营收规模约为820亿美元。

其中,配备GPU的AI服务器成为市场增长的核心引擎,2025年同比增长46.7%,占据整体市场价值近一半份额。而超大规模数据中心和云服务提供商是这一轮投资需求的主要推动者。

当被问及CPU在通用人工智能(AGI)中扮演着怎样的重要角色时,Rene Haas回应称,无论是云计算,还是AI数据中心,CPU都承担着大量的数据传输、协同调度和数据处理工作,而代理式AI的落地,更是让这一工作的负荷大幅增加。

他进一步解释说,由于AI智能体全年无休持续运行,且还能自主生成新的智能体,整个系统的运行压力因此急剧增大。而代理式AI的绝大部分工作并非词元(Token)生成,而是词元的调度与分发、协同编排,以及服务管理,这些工作都只能由CPU来完成。

数据显示,随着企业不断扩大由智能体驱动的应用规模,数据中心对每吉瓦(GW)功耗提供的CPU算力需求将增长至当前的四倍以上,这意味着必须在相同功耗限制下实现算力的大幅提升。

这一趋势催生了面向AI规模化基础设施的CPU,这一新类型的CPU既能支撑高吞吐量所需的性能,又能满足实际功耗限制下的能效要求,同时采用简化架构,摆脱x86处理器的额外开销与复杂性。

实用主义的胜利

Arm AGI CPU采用了台积电最先进的3纳米工艺,通过“芯粒”(Chiplet)技术集成了136个Neoverse V3核心,并同时提供每核心6GB/s内存带宽,时延低于100 ns。对于需要频繁处理小规模、多任务跳转的代理式AI来说,低于100纳秒的低延迟内存响应远比单纯的高带宽更重要。

在扩展性和能效方面,Arm AGI CPU采用300瓦TDP设计,每线程独立核心,可在持续负载下提供确定性性能,避免降频与线程闲置。支持高密度1U服务器机箱的风冷部署方案,单机架可支持多达8,160个计算核心;同时也支持液冷系统,单机架可实现超过 45,000个核心的部署规模。

在内存技术上的选择上,Arm并没有跟风采用昂贵且供应紧张的高带宽内存(HBM),而是采用了高度优化的12通道DDR5方案,速率为8,800 MT/s。这种“去HBM化”的设计,不仅降低了芯片的量产成本,也绕开了当前半导体供应链最脆弱的环节。

Rene Haas在发布会上展示了一组令投资者振奋的数据:在针对代理式AI的实际负载中,Arm AGI CPU的单机架性能达到了主流x86平台的两倍以上。在Arm看来,x86的问题不是性能不够,而是架构带来的不可预测性与效率损耗。Arm想要建立的新标准是“性能可扩展,功耗可预测”。因为在代理式AI场景下,系统需要24×7持续高负载运行,x86因核心争抢资源、降频等问题,实际表现往往会打折扣。

更令云服务巨头动心的是财务成本。Rene Haas指出,由于Arm芯片在能效上的代差优势,在构建吉瓦(GW)级规模的AI数据中心时,采用Arm方案可比传统x86方案节省约100亿美元的资本支出。在全球电力资源日益紧张的背景下,这种“高能效比”已成为一种极具杀伤力的商业通货。

根据国际能源署的统计,2024年全球数据中心电力消耗约415太瓦时(TWh),占全球电力消耗的1.5%左右。预计到2030年,数据中心电力需求将增长至约945太瓦时,占全球电力总量的近3%。

Arm云AI事业部执行副总裁Mohamed Awad指出,如果要与专用AI加速器相比,专用AI加速器的核心职责是生成词元,而Arm AGI CPU则负责词元的分发,并根据生成结果执行相应操作,二者对应侧重于不同的负载。未来,这两类芯片会在数据中心内实现更深度的协同部署。而随着代理式AI的落地普及,承担这类执行类工作的CPU市场需求也会持续攀升。

说了很多硬件的话题。但其实,如果将时间拨回五年前,Arm在数据中心的最大障碍并非硬件,而是软件生态。

Mohamed Awad也承认,当时Arm与x86在软件成熟度上存在明显差距。但过去几年,随着主流云厂商与开源社区的持续投入,这一差距正在缩小。

“事实上,放眼全球AI应用场景,绝大多数AI部署均以Arm CPU作为核心架构,诸多AI核心软件更是率先基于Arm架构开发。基于此,我们对Arm在数据中心领域承载各类现代工作负载的软件生态布局充满信心。” Mohamed Awad说道。

盟友还是对手?

Arm下场造芯,引发了市场对其与Amazon、Meta、Google等既有授权客户发生竞争的担忧。这些科技巨头此前一直利用Arm的技术设计自研芯片(如Graviton和Axion)。 

但Rene Haas认为,如今数据中心的架构日趋复杂,涉及存储卸载、网络卸载等需求,还需要用于头节点和数据分发的CPU等,即便是行业巨头,也难以做到所有环节全部自研。他举例说,“谷歌自研了TPU,但他们依然从NVIDIA采购大量GPU。可见,企业自研芯片,并不意味着其自研方案就能满足全部需求。”因此,考虑到这样的缺口,企业会根据应用场景、业务领域或解决方案的具体需求,选择从外部采购。

为此,Arm确立了“三轨并行”的商业模式:IP授权—继续向顶级客户提供最底层的设计图纸;计算子系统(CSS)—提供预集成的半成品,缩短客户自研周期;量产芯片—为Meta和OpenAI等追求极速部署、不愿负担芯片设计高昂成本的客户提供成品,核心战略是通过产品矩阵的拓展满足广泛客户的多元化需求。

这种分层递进的商业模式,在半导体行业尚无先例。也再次应证,Arm正在从一家“IP 供应商”转型为“计算平台提供商”。通过提供从核心IP到参考设计、再到量产芯片的全栈能力,Arm为不同层级的客户提供了按需选择的灵活性——希望自研的可以用IP,想要加速的可以拿CSS,想要直接部署的可以选芯片。

Meta基础设施部门对Arm表示了支持。作为该芯片的早期合作伙伴,Meta计划将其与自研的MTIA加速器协同部署,以优化其35亿用户的AI体验。

除Meta外,Arm还确认与Cerebras、Cloudflare、F5科技、OpenAI、Positron、Rebellions、SAP、SK电讯等企业达成进一步的商务合作。这些客户将在代理式CPU 核心应用场景中部署Arm AGI CPU,覆盖加速器管理、控制平面处理、云与企业级API、任务与应用托管等领域。

超大规模云服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的50余家领军企业,也对Arm计算平台向芯片领域拓展表示支持。其中包括亚马逊云科技、博通、谷歌、Marvell、美光、微软、NVIDIA、三星、SK海力士、台积公司等行业标杆企业。

财务野心:2030蓝图

对于华尔街而言,最核心的数字在于Arm的营收预测。Rene Haas宣布,Arm计划到2030 年实现250亿美元的年营收,每股收益(EPS)9美元。相比目前约50亿美元的营收规模,以及1.75美元的每股收益,这意味着Arm要在未来5年内实现5倍增长。

也就是说,到2030年,Arm将拥有两大独立且实力强劲的业务板块:一是IP业务,它将保持超60%的高运营利润率,营收突破100亿美元;二是芯片业务,运营利润率将超过30%,营收将达到150亿美元。分析人士认为,Arm正试图模仿苹果公司的路径——通过软硬件的垂直深度整合,在攫取更高市场份额的同时,提升单核心价值。

Mohamed在采访中透露:目前已有超过一万家客户在云环境中使用基于Arm架构的产品,但在此之前,这些客户并没有机会在本地部署类似的方案。Arm AGI CPU的出现,让他们能够基于相同的IP基础,在本地获得与云端非常相似的体验。这为云服务商和客户都创造了新的增长机会。

事实上,从边缘控制器到高性能自主化系统,在计算产业历经数十年迭代后,Arm技术已经成为当前众多智能基础设施的基石。目前,全球100%联网人群日常使用Arm技术,基于Arm架构的芯片累计出货超3500亿颗,全球有2200万开发者基于Arm平台进行全栈软件开发。

Arm AGI CPU消息公布之后,Arm股价表现强劲。投资者显然押注,在代理式AI引发的算力军备竞赛中,Arm这位曾经的“幕后导师”已经准备好接管战场。




Baidu
map