欢迎访问江南电竞入口安卓版

阿里领投2.9亿美元,重注下一代AI“世界模型”

2026-04-10 来源:电子工程专辑
84

关键词: 世界模型 生数科技 阿里巴巴 大型语言模型 AI视频生成

随着大型语言模型(LLM)的局限性逐渐显现,全球人工智能的竞赛焦点正从“文本生成”转向“模拟现实世界”。

4月10日消息,阿里巴巴已领投人工智能视频生成工具Vidu的开发商——生数科技(Shengshu Technology)B轮融资,投资金额达20亿元人民币(约合2.9亿美元)。这一巨额投资意味着科技巨头正全力押注“世界模型”,试图构建一种能更好复制现实世界的新型人工智能。

本轮融资由阿里巴巴主导,好未来教育和百度风投也参与其中。

这是生数科技在短短两个月内完成的第二次大规模融资,此前该公司刚在启明创投等机构的支持下完成了6亿元人民币的融资。尽管生数科技拒绝透露最新的具体估值,但密集的资本注入已显示出市场对这一技术路线的高度认可。

此次投资的核心逻辑,在于行业对当前主流AI技术路线的深刻反思。过去几年,以OpenAI的ChatGPT为代表的基于文本训练的大型语言模型主导了市场。然而,随着应用场景的深入,开发者们开始意识到,仅靠文本难以让AI真正理解复杂的物理规律。

生数科技认为,“基于视觉、音频和触觉等多模态数据构建的通用世界模型,比大型语言模型更能自然地捕捉物理世界的运作方式,”这家成立仅三年的初创公司在一份声明中阐述了其技术愿景。

生数科技创始人朱军进一步补充道:“我们的目标是将感知与行动联系起来。”他希望通过这种新型模型,使人工智能系统能够更好地模拟和预测现实世界的行为,从而打破数字世界与物理世界的隔阂。

根据AI分析机构的数据,生数科技于今年1月发布的Vidu Q3 Pro型号,在利用文本和图像生成视频的AI模型中已跻身全球前十。这一技术实力也是吸引阿里巴巴入局的关键因素。

实际上,阿里巴巴在“世界模型”领域的布局早已悄然展开。作为电商起家的科技巨头,阿里不仅在2月推出了一款用于驱动机器人的模型,还发布了用于视频生成的免费开源人工智能模型。

除了生数科技,阿里巴巴近期还领投了PixVerse的6000万美元融资。PixVerse今年早些时候发布了一个AI世界模型,允许用户在视频生成过程中精确控制视频的展开方式。与此同时,百度和百度风投也在上个月领投了Tripo AI的5000万美元融资。Tripo AI致力于利用AI技术从照片快速生成3D数字模型,其明确表示正在摆脱语言模型所使用的技术,转向基于物理空间的AI工具开发。

这一轮投资热潮的背后,是全球科技界对AI下一阶段形态的共识。美国科技杂志《连线》的联合创始人凯文·凯利(Kevin Kelly)上个月在其Substack专栏中撰文指出,世界模型对于机器人技术至关重要,因为这项技术需要的不仅仅是LLM才能发挥作用。

凯利表示:“最终,要复制人类智能,人工智能需要三个要素:推理能力、对物理世界的理解以及持续学习。”他特别强调,虽然目前的聊天机器人已经构建了知识元素,但“世界模型是亟需突破的关键领域”。

在激烈的市场竞争中,中国科技企业正试图通过“世界模型”实现弯道超车。在OpenAI逐步关闭其视频生成模型Sora的相关服务之后,包括字节跳动、快手在内的多家公司纷纷推出了类似的AI视频生成工具。

生数科技周五透露,公司已与多家开发具身智能(Embodied AI)的公司建立了战略合作伙伴关系。这些合作旨在将AI技术应用于与物理世界互动的人形机器人等系统,服务于工业、商业和家庭环境。

 




Baidu
map