IBMは、ミッション・クリティカルな事業運営に必要なセキュリティと回復力を維持しながら、ジェネレーティブおよびエージェント・ベースのAIワークロード向けに高性能かつ低レイテンシーの推論を実現するように設計された新しいAIアクセラレーター、IBM Spyreアクセラレーターの発売を発表しました。このソリューションは、IBM z17およびLinuxONE 5システム向けには10月28日に、Power11サーバー向けには2025年12月初旬に提供される予定です。
Spyreアクセラレータは、IBMのAIハードウェア・センターがアルバニー大学の先進AIシステム・センターと共同で開発したもので、イノベーションを研究からエンタープライズ・グレードの製品へと迅速に移行させるIBMの能力を反映しています。このアクセラレーターは、32コア、256億トランジスタの5nmプロセスで構築されており、PCIeカードとして実装され、IBM ZまたはLinuxONEでは48枚、IBM Powerでは16枚まで拡張可能です。
IBMのTelum IIプロセッサーと組み合わせることで、Spyre Acceleratorは、予測分析、詐欺検出、小売自動化に理想的なセキュアで低レイテンシーのAI処理を実現します。IBM Powerサーバー上で、ユーザーは企業のワークフローにシームレスに統合するAIサービスのカタログにアクセスし、ワンクリックでモデルを展開できます。
こちらもお読みください: ジェネレーティブAIの国内開発を加速する「GENIAC」を発足
Spyre Acceleratorは、最大128までのプロンプトサイズをサポートしています。毎時800万以上のドキュメントを処理できます。これにより、ナレッジベースを迅速に統合し、AIを大規模に展開することが容易になります。 アイビーエム は、オンプレミスのエンタープライズグレードのジェネレーティブAIをリードしています。パフォーマンス、スケーラビリティ、エネルギー効率の組み合わせがそれを可能にします。

