百万Token时代来袭,推理算力争夺战悄然打响

百万Token时代来临,算力对决谁主沉浮

推理算力 百万Token 产业竞逐 算力瓶颈 智能时代

推理算力面临挑战,百万Token时代来临,产业竞逐加速。

   《科创板日报》9月13日讯在AI发展热潮中,模型参数的激增和算力的不断堆砌曾是行业竞争的重点。然而,如今在生成式AI逐步实现大规模应用的背景下,竞争焦点已转向推理能力:在实际应用场景中,面对海量数据的即时调用、百万Token级别的连续推理以及长上下文的高效处理,不仅提高了对算力的需求,也重新塑造了算力基础设施的价值链条。

   在最近的AI基础设施峰会上,英伟达推出了全新的RubinCPX GPU。据官方介绍,这款芯片专门针对长上下文推理任务进行优化,是英伟达首款为需要一次性处理大量知识(数百万级别tokens)并执行AI推理的模型而设计的芯片。

   英伟达称,这颗芯片为客户带来了“前所未有的投资回报率”——每部署价值1亿美元的新芯片,预计将带来50亿美元的收入,投资回报率高达50倍,远超GB200NVL72的约10倍回报率。与此同时,公司还宣布GB300NVL72机架级系统在最新的MLPerf推理基准测试中刷新了推理性能记录。 从市场角度来看,这一高回报率的数据不仅展示了该芯片的技术优势,也反映出其在实际应用中的强大潜力。随着人工智能计算需求的持续增长,具备如此高效能与高回报的产品,无疑将在竞争激烈的市场中占据重要地位。而MLPerf测试成绩的突破,则进一步验证了公司在高性能计算领域的技术实力。

   花旗研究表示,在ASIC市场竞争日益激烈的背景下,英伟达以往每年一次的产品发布节奏正在加快,RubinCPX提前进入产品路线图,预示着“推理时代”已正式开启。

   分析师表示,RubinCPX的推出以及在MLPerf中取得的新成绩,进一步体现了英伟达在AI基础设施领域的持续创新实力。随着AI推理需求,尤其是长语境推理需求的快速增长,英伟达的新产品组合有望推动收入实现明显提升。

   值得关注的是,本周引发全球市场关注的甲骨文公司,也提及了推理市场需求的激增。

   在业绩会上,公司创始人拉里·埃里森明确表示,人工智能正在深刻重塑甲骨文公司。他指出,AI推理市场将“远大于”AI训练市场,而当前市场上的推理算力正面临紧张局面,逐渐被消耗殆尽。

   尽管甲骨文因订单指数级增长引发市场关注,且其对OpenAI的依赖性受到质疑,导致股价在一度飙升后连续两天下跌。但摩根大通也指出,甲骨文在获取OCI业务方面表现出色,展现出“令人印象深刻的成就”,同时对其在人工智能领域的长期发展持积极态度。 从当前市场反应来看,投资者对甲骨文短期内的业绩表现存在分歧,但机构对其技术布局和战略方向仍保持一定信心。这反映出科技行业在AI赛道上的竞争日趋激烈,企业能否持续创新并建立独立的技术生态,将成为未来发展的关键因素。

   ▌算力基础设施进入长上下文推理新阶段

   实际上,从更长的时间线来看,可以发现海内外大型科技公司在Token调用量方面已出现明显加速的拐点,推理端的算力需求正在快速增长。这一趋势反映出人工智能应用的持续深化,以及对计算资源依赖程度的不断提升。随着大模型在各行各业的落地,算力瓶颈或将逐步成为影响技术发展的重要因素。

   根据今年5月Google I/O大会的数据显示,Google的Token月均调用量从去年同期4月的9.7万亿增长至今年4月的480万亿,增幅达到50倍。微软在三季度电话会议中透露,其Azure AI基础设施在今年第一季度处理的Token总量超过100万亿,与去年同期相比增长了5倍,其中3月份单月的Token调用量达到50万亿。从国内互联网大厂的情况来看,今年5月字节火山引擎的Token日均调用量为16.4万亿(月均约508万亿),是去年5月的137倍。

   过去一年,随着生成式AI逐步进入规模化应用阶段,行业对“长上下文”处理能力的需求迅速增长。无论是企业级知识库问答、代码生成,还是多模态长视频生成,都要求模型在面对超长输入序列时仍能保持推理的准确性与计算的高效性。然而,当前的GPU在处理这类任务时,普遍存在内存带宽瓶颈和计算冗余问题,导致算力利用率难以充分发挥。 在我看来,这一技术瓶颈不仅影响了模型的实际应用效果,也制约了生成式AI在复杂场景下的进一步拓展。要突破这一限制,除了硬件层面的优化外,算法层面的改进同样关键。未来,如何在保证性能的同时提升效率,将成为推动生成式AI持续发展的核心议题之一。

   东吴证券分析指出,从产业角度看,RubinCPX的发布不仅是英伟达产品线的一次升级,也标志着海外算力基础设施迈入“上下文处理与内容生成协同运作”的新阶段。随着百万Token推理能力和长视频生成成为AI应用的标配,硬件与软件之间的耦合程度显著增强,算力产业链的整体价值也随之提升。无论是GPU、存储设备、网络设备,还是相关的高速PCB、光模块和封装技术,相关厂商都将有望获得深度受益。

相关阅读

黄仁勋揭秘:英伟达曾濒临破产,全年无休背后的焦虑生存法
抗湿冷标准落地,利郎引领行业新风向
C909中国支线新势力强势突围:174架交付创纪录,覆盖全球12国,撑起国内六成以上支线天空
新东方员工实名曝光:996背后数字化行业的隐秘真相

发表评论

请输入您的姓名
请输入有效的邮箱地址
请填写评论内容

业界资讯栏目

每日讯闻业界资讯栏目为您提供第一时间的新闻报道、深度分析和独家视角。

即时资讯

全天候更新热点事件,第一时间传递重要新闻

深度分析

专业团队解读事件背景与深层影响

24小时热文

充电宝新规即将实施,老用户受影响吗?专家深度解读
2025-11-28 13:39

充电宝新规来袭,老用户将何去何从?

华为云巨变:张平安掌舵董事长,周跃峰接任CEO,五大全新产品线震撼亮相
2025-11-28 13:35

华为云重磅 reshuffle:张平安升任董事长,周跃峰接棒CEO,五大全新产品线横空出世引爆行业变革

中国东航物流‘上海—巴黎’全货机航线启航,打通亚欧空中新动脉
2025-11-20 14:30

中国东航物流上海—巴黎全货机航线启航,打造亚欧空中新动脉

1299元起!华为X3 Pro日照金山限量版震撼登场:11月25日发售,网友惊呼路由界的艺术品
2025-11-20 14:27

华为X3 Pro日照金山限量版首发:1299元起售,11月25日震撼开抢,网友直呼路由界的梵高之作

英伟达Q3爆冷超预期,云端GPU全数售罄引行业震动
2025-11-20 12:55

英伟达Q3逆袭引爆市场,云端GPU遭疯抢告急

《移动终端可靠性国标明年5月实施,行业空白正式填补》
2025-11-20 12:06

《移动终端可靠性国标明年5月实施,行业空白正式填补》 → **《2026年5月起,手机质量将迎国标严规,用户用机更安心》**

沙特HUMAIN携手巨头布局AI新生态
2025-11-20 12:06

沙特HUMAIN联手科技巨擘打造AI未来新引擎

地方医改新药方:国家卫健委案例库揭秘
2025-11-14 13:23

地方医改破局:国家卫健委揭秘创新药方

存储芯片告急!中芯国际预警:大内存手机或将一机难求
2025-11-14 13:22

内存危机爆发!中芯国际紧急预警:高端手机或将集体断货

2025中国机器人大会重磅发声:郑军奇揭秘工业机器人可靠性跃升新纪元
2025-11-14 11:47

副标题:从能用到敢用:郑军奇首曝工业机器人可靠性颠覆性突破

友情链接

与优秀科技平台合作,共同构建创新数字生态

合作伙伴持续增加中,期待与更多优秀平台建立联系