专题:2026年度国际消费电子展(CES)
摘要
英伟达BlueField-4驱动英伟达推理上下文内存存储平台,这是一款专为千兆级推理打造的新型人工智能原生存储基础设施 ,可助力智能体人工智能的加速与扩展 。
这款全新存储处理器平台面向支持长上下文处理的智能体人工智能系统,具备闪电般迅捷的长短时记忆能力。
推理上下文内存存储平台能够拓展人工智能智能体的长效记忆,并实现机柜级人工智能系统集群间的高带宽上下文共享 ,使每秒令牌处理量与能效提升最高达5倍。
在英伟达Spectrum-X以太网的支持下,多轮对话人工智能智能体的扩展上下文内存可提升响应速度、增加单GPU吞吐量,并助力智能体推理的高效扩展。
在国际消费类电子产品展览会(CES)上 ,英伟达今日宣布:作为全栈式英伟达BlueField平台的重要组成部分,英伟达BlueField-4数据处理器将为英伟达推理上下文内存存储平台提供算力支持 。该存储平台是面向下一代人工智能前沿领域打造的全新人工智能原生存储基础设施。
随着人工智能模型向万亿级参数与多步骤推理方向演进,其产生的海量上下文数据需以键值(KV)缓存的形式存储——这类数据对保障模型精度、优化用户体验及实现任务连续性至关重要。
键值缓存无法长期存储于图形处理器(GPU)中,否则会造成多智能体系统实时推理的性能瓶颈 。人工智能原生应用亟需一种新型可扩展基础设施 ,用于这类数据的存储与共享。
英伟达推理上下文内存存储平台通过扩展GPU内存容量,构建起上下文内存支撑架构,实现节点间的高速数据共享。相较于传统存储方案 ,该平台可使每秒令牌处理量提升最高5倍,能效提升最高5倍 。
英伟达创始人兼首席执行官黄仁勋表示:“人工智能正在重塑整个计算技术栈——如今,这场变革也延伸至存储领域。人工智能的形态已不再局限于单次交互的聊天机器人 ,而是进化为能够理解物理世界 、进行长周期推理、锚定事实依据、借助工具执行实际任务,并同时具备短时与长效记忆能力的智能协作体。凭借BlueField-4,英伟达正携手软硬件合作伙伴 ,为人工智能的下一个前沿领域重塑存储技术栈 。”
英伟达推理上下文内存存储平台能够提升键值缓存容量,加速机柜级人工智能系统集群间的上下文共享。同时,多轮对话人工智能智能体的持久化上下文可优化响应速度 、提升人工智能工厂吞吐量 ,并为长上下文、多智能体推理的高效扩展提供支持。
这款由英伟达BlueField-4驱动的平台,核心能力包括:
支持英伟达鲁宾架构的集群级键值缓存容量,可满足长上下文、多轮对话智能体推理所需的规模与效率要求 。
相比传统存储方案,能效提升最高达5倍。
基于英伟达DOCA框架 ,实现人工智能节点间键值缓存的智能 、加速共享,并与英伟达NIXL函数库及英伟达Dynamo软件深度集成,从而最大化每秒令牌处理量、缩短首令牌生成延迟 ,并提升多轮对话响应性能。
由英伟达BlueField-4管理的硬件加速键值缓存部署机制,可消除元数据开销、减少数据迁移,并保障GPU节点对缓存的安全隔离访问。
依托英伟达Spectrum-X以太网实现高效的数据共享与检索 ,该以太网技术可作为高性能网络架构,为基于远程直接数据存取(RDMA)的人工智能原生键值缓存访问提供支撑 。
日立数据系统 、IBM、努塔尼克斯、普纯存储、超微电脑 、VASTData及WEKA等存储领域企业,已率先基于BlueField-4打造下一代人工智能存储平台。相关产品将于2026年下半年正式面市。
发表评论
暂时没有评论,来抢沙发吧~