【布局】OpenAI年底上线超100万个GPU
关键词:OpenAIFuriosaAI3D-ICAI芯片电机磁体
1.Sam Altman:OpenAI年底上线超100万个GPU;
2.韩国AI芯片创企FuriosaAI斩获LG大单;
3.破局 AI 算力困局:3D-IC 技术架构的颠覆性变革;
4.日本Proterial开发无需重稀土的电动汽车电机磁体,已发货样品;
1.Sam Altman:OpenAI年底上线超100万个GPU;
OpenAI首席执行官Sam Altman在X上的一篇新文章中透露,OpenAI有望在今年年底前“上线超过100万个GPU”。
对比之下,埃隆马斯克的xAI在今年早些时候凭借其Grok 4模型引起轰动,该模型运行在大约20万个英伟达H100 GPU上。
OpenAI的计算能力是Grok 4模型的5倍,但对于Altman来说这还不够。“为团队感到非常自豪......”他写道,“但现在他们最好开始研究如何将其提高至100万个GPU的100倍。”
早在2月份,Altman就承认OpenAI不得不放慢GPT-4.5的推出速度,因为他们实际上“GPU 用完了”。这可不是小问题;考虑到英伟达的顶级AI硬件到明年的订单也已售罄,这可谓一记警钟。此后,Altman将计算扩展作为首要任务,寻求合作伙伴关系和基础设施项目。
按照目前的市场价格,1亿块GPU的成本约为3万亿美元——几乎相当于英国的 GDP,这还不包括电力需求或容纳这些GPU所需的数据中心。英伟达短期内根本不可能生产出这么多芯片,更不用说满足所有GPU的能源需求了。
OpenAI并非仅仅囤积英伟达硬件。虽然微软的Azure仍然是其主要的云服务骨干,但OpenAI 已与甲骨文合作构建自己的数据中心,并且据传正在探索谷歌的TPU加速器,以使其计算堆栈多样化。这是一场更大规模军备竞赛的一部分,从Meta到亚马逊,每家公司都在自主研发AI芯片,并大力投资高带宽内存(HBM),以支持这些庞大的模型。Altman则暗示了OpenAI自己的定制芯片计划,考虑到公司不断增长的规模,这并非偶然。(校对/李梅)
2.韩国AI芯片创企FuriosaAI斩获LG大单;
韩国AI芯片创企FuriosaAI致力于设计芯片与英伟达竞争,在拒绝Meta Platforms的8亿美元收购要约数月后,终于签下首份重要合同。
经过七个月的严格评估,这家初创公司的AI芯片RNGD最终获得LG AI Research的批准,该芯片涵盖性能和效率。FuriosaAI CEO June Paik表示,LG将使用该芯片为其Exaone大型语言模型提供支持。
作为合作的一部分,FuriosaAI和LG计划利用Exaone在从电子到金融等多个行业部署RNGD服务器。这些服务器还将为LG的内部企业AI代理ChatExaone提供支持,LG计划将其扩展到外部客户。
LG的批准是对FuriosaAI的肯定,FuriosaAI是少数几家希望在后ChatGPT时代AI基础设施繁荣发展中分一杯羹的韩国芯片设计公司之一。 RNGD芯片的设计初衷不仅是为了挑战行业领导者英伟达,也是为了挑战其他初创公司,例如Groq、SambaNova Systems和Cerebras Systems。
今年3月,FuriosaAI拒绝了Meta的收购要约,选择独立运营,此举引发公众关注。据知情人士透露,FuriosaAI计划在最终进行首次公开募股(IPO)之前进行融资。
FuriosaAI由曾在三星电子和AMD公司工作的June Paik于2017年创立,致力于开发用于AI推理或服务的半导体。该公司声称,其每瓦推理性能比图形处理器(GPU)提高2.25倍。
与韩国同行Rebellions和Semifive一样,FuriosaAI正试图利用过去十年围绕三星等公司涌现的庞大的半导体生态系统,其中包括人才、供应商和政府激励措施。
FuriosaAI正在努力争取美国、中东和东南亚地区的新客户。June Paik表示,预计今年下半年将达成类似协议。(校对/赵月)
3.破局 AI 算力困局:3D-IC 技术架构的颠覆性变革;
AI 时代的数据洪流与算力瓶颈
从日常生活中的语音助手和自动驾驶,到工业上的全自动工厂和 AI 辅助设计,人工智能技术正在为我们的世界带来革命性的变化。在人工智能的应用中,无论是文字、语音、还是视频,都需要被转化为一串串的基本的数据单元,以供 AI 处理器识别并进行运算处理。这些单元被称之为 token。
现代的 AI 系统往往要面临同时产生的海量 token 输入,并且需要在一秒内完成十亿甚至百亿数量级的 token 处理。这种高并发、高带宽的需求对计算机架构和芯片的设计提出的新的挑战:在搭载于传统的二维芯片上,尤其是使用冯·诺伊曼结构的计算机中,处理器与内存之间的总线好比乡间双向二车道的小路,数据传输速率和带宽十分有限,已经远不能承载 AI 时代的数据洪流。数据显示,当前 AI 芯片的算力利用率通常低于 30%,其主要原因正是处理器与内存之间数据传输速率与带宽跟不上处理器的运算速度。这种被称为“内存墙”的现象已经成为了限制 AI 系统性能的瓶颈。
3D-IC——突破维度的技术革命
为了解决“内存墙”对 AI 系统的桎梏,当今主流的 AI 芯片大多采用了2.5D 的方式设计制造。2.5D 就是将存储和运算芯片摆放在同一平面上,借助平面下方的中介层传输芯片来实现千和万数量级的连接,初步解决了存储和运算之间数据通路拥塞的问题。此外,将传统的大芯片切分为更小的存储和运算芯片后,良品率也能得以大幅提升。但如果要满足更严苛的高并发、高带宽的需求,我们就需要升级到 3D 的设计,将存储芯片直接堆叠在运算芯片之上。
在 3D-IC 的工艺中,金属微凸块(micro bump)或复合键(hybrid bonding)可以将上下堆叠的两个芯片直接连接。如有信号需要穿过整层芯片,则可以通过硅通孔(TSV)穿过芯片的硅衬底、器件层、甚至金属层。3D-IC 结构下的芯片间垂直互连进一步缩短了数据传输距离,从而提高了数据传输速率,减小了传输功耗。由于芯片的整个接触面都可以摆放连接接口,芯片间并行连接的数量得以有极大的增加,带宽可由此得到若干个数量级的提高。以上将内存和运算放在一起的结构被称为近存运算,是当前打破“内存墙”的重要手段。
最先进的芯片设计者甚至会在面对不同运算需求时,平衡运算性能和设计制造成本,同时采用 2.5D 和 3D 的连接技术,即 3.5D 芯片。3.5D 的设计可以更好地支持异构运算以及处理海量数据。
Cadence Integrity 3D-IC——全流程设计平台
3D-IC 的设计不同于传统的封装设计和芯片设计,需要创新的设计方法学和工具的支持。传统的先进封装流程会先由封装决定每个芯粒的接口,之后将设计目标拆分给芯片设计团队。然而这样的流程无法实现跨芯片、芯片与封装之间的系统级优化。3D-IC 的设计需要把传统 2D 芯片中的性能、功耗、面积、成本(PPAC)指标驱动的设计拓展到整个 3D 系统中。
Cadence 致力于提供软件、硬件和 IP 产品,助力电子设计概念称为现实。基于此,Cadence 率先推出了能在在单一平台上实现 3D-IC 全流程的 EDA 软件——Integrity 3D-IC,给业界提供了一套完整的 3D-IC 解决方案。该方案支持所有 3D-IC 设计类型和各种工艺节点,并让 3D-IC 设计的各个部门通过 Cadence 的数字设计平台Innovus、模拟及定制化设计平台Virtuoso和封装与板级设计平台Allegro实现全系统跨平台的无缝协作。为了达到更好的 3D 系统的设计效果,Integrity 3D-IC 将 3D-IC 的设计流程拆分为:
早期架构探索– 探索分析不同的 3D 堆叠架构,快速进行方案迭代。优化 bump 和 TSV 的规划与摆放。
中期设计实现– 3D 系统的 partition 与floorplanning,3D placement、CTS、routing 及优化,跨芯片的静态时序分析与收敛。
后期多物理场签核– 包括对 3D-IC 签核至关重要的系统级热分析、电源分配网络分析,3D 系统的信号完整性与电源完整性,3D 静态时序分析等多物理场的签核,系统级的 LVS 和 DRC。
从而使 3D-IC 芯片的堆叠、互联以及各芯粒都能根据全系统 PPAC 的最优或次优解完成规划与实现,让芯片公司设计出更有竞争力的 3D-IC 产品。
未来展望:3.5D 异构集成时代
在半导体产业迈向新征程的关键节点,Cadence 始终以创新者的姿态深耕行业前沿。面向未来,Cadence 满怀热忱与期待,愿与行业合作伙伴同心同行,共同推动下一代 3.5D 的技术创新。这不仅是技术参数上的迭代升级,更是对芯片设计方法学的深度重塑,力求为行业发展注入新动能。
Unleash your imagination,与 Cadence 携手,将创意变成现实!
4.日本Proterial开发无需重稀土的电动汽车电机磁体,已发货样品;
日本金属制造商Proterial开发出无需使用重稀土金属的电动汽车电机磁体,这一突破有望缓解中国限制此类材料出口带来的供应链担忧。
Proterial(前身为日立金属)开发出两种钕磁体,因其高性能,可用于精密机器和电动汽车。该公司已开始从其量产工厂发货一种磁体的样品。第二种具有更高耐热性的磁体样品预计最早将于2026年4月开始发货。
中国于今年4月对稀土金属实施出口限制,引发了国际社会对供应链的担忧。日本汽车制造商铃木汽车公司因稀土短缺于5月停产其Swift紧凑型轿车。广泛采用不使用重稀土金属的磁体可以减少供应链不稳定。
钕磁体可用于缩小电动汽车电机的尺寸,但需要添加铽和镝等重稀土元素才能提高耐热性。Proterial的新技术使其能够在不使用重稀土元素的情况下保持高性能。
这些新型磁体可以轻松应用于现有电机。它们采用主流生产工艺制造,使用现有的产线生产,并且支持进行形状调整以适应各种类型的电机,方便以低成本进行量产。
Proterial并非首家开发不含重稀土元素的钕磁体公司。Daido Steel也开发出用于电动汽车电机的类似磁体,但这些磁体需要调整电机的形状和冷却方式,以匹配使用重稀土元素的磁体的输出功率。
