AI和高性能计算工作负载持续挑战存储基础设施的极限。实时推理的整合将进一步增加对基础设施的需求。为了保持领先地位,行业需要能提供高吞吐量、低延迟和高效扩展的解决方案。
AIC和ScaleFlux最近对其最新存储创新进行了测试,在AIC F2026 AI推理服务器中集成了26个ScaleFlux CSD5000 NVMe固态硬盘和两个NVIDIA BlueField-3数据处理单元(DPU),这是一个2U闪存阵列(JBOF)。
结果如何?随着需求增加而扩展的突破性性能。
测试设置和方法
通过与NVIDIA和ExponTech的合作,ScaleFlux和AIC提供了一台装有26个ScaleFlux CSD5000 SSD和两个BlueField-3 DPU的AIC F2026,以完成他们的测试集群。F2026通过NVIDIA Spectrum交换机连接到服务器,这些服务器也配备了用于网络连接的BlueField-3 DPU。
ExponTech下一代分布式存储软件WADP(一个统一数据平台)在F2026推理AI服务器的DPU上运行。WADP同时支持:
- 需要超高IOPS和超低延迟的事务性数据(如数据库)
- 需要海量容量、超高吞吐量和高元数据性能的大规模AI数据
测试团队进行了一系列随机和顺序IO测试,测试块大小包括(4K、16K、64K、256K、1M),以及线程数(1、4、16)和队列深度(1、8、32)的各种组合。这些测试在两个服务器端DPU和四个服务器端DPU的场景下重复进行。团队收集了每个测试场景的IOPS、吞吐量和延迟数据。

性能突破:通过BlueField-3 DPU实现扩展
我们不会在这篇博客中详细介绍所有结果,而是聚焦亮点。我们测试中最令人兴奋的发现之一是性能如何随着DPU数量的增加而扩展。
通过利用BlueField-3,我们实现了硬件加速存储和网络,从而释放CPU资源并显著减少瓶颈。这种优化不仅提升了系统性能,还允许更高效的数据处理和改进的整体系统可靠性。
BlueField DPU的使用通过从CPU卸载任务来加速网络和存储访问,确保更快的数据传输速率和更低的延迟。
关键性能指标
指标 | 2个服务器端DPU的结果 | 4个服务器端DPU的结果 |
---|---|---|
4K随机读取 | 150万IOPS,平均延迟89微秒(包括网络) | 280万IOPS,平均延迟89微秒 |
4K随机写入 | 150万IOPS,平均延迟49微秒 | 190万IOPS,平均延迟49微秒 |
256K顺序读取 | 36GB/秒,平均延迟89微秒 | 55GB/秒,平均延迟89微秒 |
256K顺序写入 | 44GB/秒,平均延迟49微秒 | 52GB/秒,平均延迟49微秒 |
结果分析
- 4K随机读取性能:展示了系统处理高强度、小块读取操作的能力。
- 4K随机写入性能:非常适合AI模型训练和频繁的检查点保存。
- 256K顺序读取性能:能够为AI和机器学习应用提供对大型数据集的高速访问。
- 256K顺序写入性能:支持持续高吞吐量的数据管道。
使用两个客户端DPU和两个服务器端DPU时,存储系统表现出令人印象深刻的性能水平。从两个扩展到四个服务器端DPU解锁了更高的吞吐量,证明了BlueField-3动态扩展存储性能的有效性。
“使用Bluefield DPU和ScaleFlux支持压缩的SSD与Spectrum交换机组合的存储系统为客户提供了高性能的网络存储解决方案和显著的成本节约。这种组合标志着我们首次看到写入速度快于读取速度”
——陈龙,NVIDIA产品营销总监
为什么这对AI工作负载至关重要
AI应用需要强大的存储性能,无论是用于训练复杂模型、运行推理,还是处理实时分析。这个解决方案带来:
✅ 超低延迟:对AI推理和实时数据处理至关重要。
✅ 无与伦比的存储密度:目前每2U可达 1.6PB有效容量 ,明年将扩展到每2U 6.6PB 。
✅ 高效率:BlueField-3 DPU处理所有I/O和网络任务,消除了存储阵列中对CPU的需求。
✅ 增强耐久性:ScaleFlux的写入减少技术延长了SSD寿命,非常适合频繁写入的AI工作负载。
✅ 适应各种工作负载:ScaleFlux CSD提供平衡的读写性能,灵活应对AI工作负载可能带来的任何I/O混合模式。
下一步是什么?未来测试计划
这次测试突显了F2026平台在其基本配置(2个DPU)下的可扩展性。
进一步的JBOF测试
我们计划使用4个DPU在JBOF中扩展测试。要将系统性能压力测试到最大,将需要扩大向JBOF发送I/O请求的服务器端DPU数量。团队还在继续调整软件和文件系统,以挖掘更多性能提升,因为在JBOF中网络连接和CSD都尚未完全饱和。
此外,我们计划与其他配置和解决方案进行比较测试,以及进行其他工作负载模拟,以更接近地模拟真实世界的I/O模式。
推理服务器测试
F2026除了Bluefield-3 DPU外,还可以配备GPU,以扩展其功能,包括计算功能,如推理。这种配置的测试计划作为未来阶段进行。
最终思考
结果不言自明:AIC和ScaleFlux,结合NVIDIA的技术,创造了为AI打造的下一代存储解决方案。
通过将BlueField-3 DPU与高效率ScaleFlux SSD配对,我们为AI和HPC客户提供了保持领先所需的性能、可扩展性和效率。
敬请期待更多更新,我们将继续突破AI存储性能的极限!