英伟达计划推出全新“推理”芯片-新华网
新华网 > > 正文
2026 03/04 10:30:12
来源:参考消息网

英伟达计划推出全新“推理”芯片

字体:

  参考消息网3月3日报道 据美国《华尔街日报》网站2月27日报道,英伟达公司计划推出一款量身定制的新型处理器,用来帮助OpenAI和其他客户构建更快更高效的工具。这将对英伟达的业务产生重大影响,并且可能重塑人工智能(AI)领域的竞争格局。

  据知情人士透露,英伟达正在设计一套用于“推理”计算的新系统。推理计算是一种能够让AI模型响应查询的处理方式。知情人士称,该系统对应的新平台将于下个月在圣何塞举行的英伟达GTC开发者大会上亮相,同时,该系统将整合由初创公司格罗克公司设计的芯片。

  推理计算一直是业内竞争激烈的领域。英伟达的竞争对手谷歌和亚马逊都设计出能够与英伟达旗舰系统相媲美的芯片。此外,随着自动化编程在科技劳动力市场的爆发式应用,市场亟需能够更高效处理复杂AI任务的新型芯片。

  一些知情人士说,OpenAI已同意成为这款新处理器的最大客户之一,这对英伟达来说无疑是重大胜利。作为ChatGPT的开发商和英伟达最大的客户之一,OpenAI过去几个月一直在寻找比英伟达芯片更高效的替代方案,并于上个月与一家芯片初创公司签署一项协议,从而获得新的选择。

  2月27日,OpenAI宣布将从英伟达购买大量“专用推理算力”,并将获得这家芯片巨头300亿美元的投资。OpenAI在宣布这一消息时,也暗示了这款新型处理器的存在。

  英伟达一直主导着图形处理器(GPU)的设计和销售,这是一种可以同时执行数十亿次简单任务的处理器。但自从AI热潮兴起以来,英伟达首次面临其旗舰产品的局限性。随着市场向推理方向转变,英伟达开始感受到来自部分客户的压力,要求其生产能够更高效地支持AI应用的芯片。

  英伟达强大的Hopper、Blackwell 和Rubin系列GPU被认为是训练大型AI模型的最佳选择,价格也相当高昂。大多数分析师估计,英伟达控制着90%甚至更多的GPU市场份额。

  但是,过去一年,对高级计算的需求已从训练转向推理。部署人工智能体和其他工具的公司希望这些工具能够颠覆数百个行业,并通过订阅费创造巨额利润。人工智能体是一种能够相对自主地代表用户执行任务的人工智能系统。

  许多构建和运营人工智能体的公司发现,传统GPU成本过高,能耗过大,而且并不适合实际运行其模型。随着智能体技术的迅猛发展,英伟达面临压力,需要开发出更经济、更节能的推理芯片。

  英伟达去年年底同意支付200亿美元,从格罗克公司获得关键技术许可,并聘请包括其创始人乔纳森·罗斯在内的高层管理团队,这是硅谷有史以来规模最大的“收购式招聘”交易之一。

  格罗克公司设计的芯片采用与英伟达不同的架构,被称为“语言处理单元”(LPU),这种芯片在推理功能方面效率极高。然而,到目前为止,英伟达对如何使用格罗克公司的技术一直讳莫如深。

  AI推理计算分为两个主要任务:预填充,即模型解读用户提示的过程;解码,即模型逐字生成响应的过程。对大型AI模型来说,预填充通常速度更快,而解码往往极为缓慢。

  编码应用已成为企业级AI最重要且最赚钱的应用之一,Anthropic公司的Claude Code编码工具通常被认为是该领域的标杆产品。但Anthropic主要依托亚马逊云科技公司和“字母表”公司谷歌云部门设计的芯片产品,而不是英伟达的芯片。

  然而,Claude最强劲的竞争对手之一是OpenAI快速发展的Codex工具。据知情人士透露,OpenAI计划利用英伟达的新系统来改进Codex。

  通常情况下,英伟达会将Vera芯片(中央处理器,即CPU)与Rubin GPU搭配使用,构建强大的数据中心服务器。但一些大型客户发现,某些智能体工作负载仅凭CPU运行效率更高。

  本月,英伟达宣布扩大与元宇宙平台公司的合作关系,包括首次大规模部署纯CPU系统,以支持元宇宙的广告定向人工智能体。这项合作使外界得以窥见英伟达的战略:不再局限于GPU,而是通过其他方式锁定AI市场的某些份额。(编译/赵菲菲)

【纠错】 【责任编辑:郭晓婷】