NVIDIAはBlueField-4を、Inference Context Memory Storage Platformと呼ばれる新しいAIネイティブ・ストレージ・セットアップの基盤として発表しました。これは、より高速なディスクやより大きなアレイのことではありません。最新のAIシステムで増大するボトルネックを解決するためのものです。モデルが大きくなり、AIエージェントがマルチステップの会話を実行するようになると、GPUがすべてをスローダウンさせることなく長時間保持することができない大量のキーバリューキャッシュデータが生成されます。.
BlueField-4は、高速、共有、永続性を維持しながら、コンテキストメモリをGPU外にシフトします。このプラットフォームは、ラックスケールのクラスタ間で、長いコンテキスト、マルチターン、エージェントベースの推論をサポートするように構築されています。. エヌビディア は、従来のストレージ・アプローチと比較して、1秒あたりのトークン数と電力効率が最大5倍向上すると主張しています。.
こちらもお読みください: Microsoft Sentinel Data LakeがセキュリティチームのAIエージェントの扱い方を変える
このプラットフォームは、BlueField-4データプロセッサ、Spectrum-Xイーサネット、およびDOCA、NIXL、Dynamoなどのソフトウェアを組み合わせて、KVキャッシュの配置、共有、分離をハードウェアレベルで処理します。これにより、データ移動が削減され、待ち時間が短縮され、最初のトークンまでの時間が改善されます。.
デル、HPE、IBM、ピュア・ストレージ、その他のストレージ・サプライヤーなどのメーカーは、現在もこれをベースにしたシステムを導入しています。利用可能になる時期は2026年後半と予想されており、AIインフラストラクチャの方向性を明確に示しています。.

