さくらインターネット、生成AI向け推論APIプラットフォーム「さくらのAIエンジン」を提供開始。さくらのクラウド」のコントロールパネルからアクセスでき、大規模言語モデル(LLM)を含む基盤モデルをAPI経由でアプリケーションに組み込むことができます。さくらのAIエンジン」は、ジェネレーティブAI向けクラウドサービス「High Firepower」をベースに、国内外の複数の基盤モデルと検索補強生成(RAG)機能をAPI経由で提供します。これにより、企業は目的や性能要件に応じて最適な基盤モデルを選択し、ジェネレーティブAIを活用したアプリケーションを自社サービスに組み込むことができます。
クラウドベースの実行環境のため、コンピューティングインフラやネットワーク構成が不要で、インフラ構築が不要です。各種AI機能をREST APIとして提供し、アプリケーション連携やプロトタイプ開発を容易にします。ベクターデータベースと連携するRAG機能にはAPIでアクセスでき、社内データを活用したチャットボットやFAQが可能。推論処理にはNVIDIA GPUリソースを採用。さくらインターネットが運営する国内データセンターで構成されるインフラ上で基盤モデルを選択できるため、すべて日本国内で利用可能。"プラットフォームモデル無料プラン "と "従量課金プラン "の2種類を用意。両プラン共通の無料利用上限を超えた場合、「無料プラットフォームモデルプラン」はAPIリクエストの料金制御を行い、「従量課金プラン」は超過分の課金を行います。なお、「無料プラットフォームモデルプラン」は申請数に上限があり、上限に達すると新規の申請は受け付けられなくなります。
こちらもお読みください: セールスフォース・ジャパン、AgentforceでAI営業コーチングを初導入
さくらインターネットは、「さくらのAIエンジン」のサービス開始に伴い、ジェネレーティブAI向けフルマネージド実行基盤「さくらのジェネレーティブAIプラットフォーム」の名称を、ジェネレーティブAI向けビジネスプラットフォーム「さくらのAI」に変更しました。今後 さくら今後は、AIを活用した様々なサービスを順次拡大し、企業の業務効率化や事業成長を支援していく予定です。
ソース ヤフー

