新しいAIモデルが発表されると、その性能を示すベンチマーク結果が公表されます。しかし、これらのベンチマークで評価されるタスクは、小学校レベルの算数(GSM8K)や大学院レベルの推論(GPQA)など一般的なものが多く、特定の産業に特化したものではありません。このギャップを埋めるために、OpenAIは "OpenAI Pioneers Program "を立ち上げました。このプログラムは、特定の産業や実世界のユースケースに合わせたAIモデルの開発を促進することを目的としています。具体的には、企業がOpenAIの研究者と協力して、よりドメインに特化した評価基準や微調整されたモデルを開発する取り組みです。
OpenAIはブログの中で、"法律、金融、保険、ヘルスケア、会計など多くの業界では、モデルベンチマークのための統一された信頼できる情報源が不足している "と指摘しています。そのため、OpenAIは今後、各業界の複数の企業と協力して、これらの評価基準を開発する予定です。この取り組みは、単にモデル開発を進めるだけでなく、社会全体とAIシステムとのより良い信頼関係を構築することを目的としています。実際、このような業界別のベンチマークがないことが、ビジネス用途へのAI導入の大きな障壁となっていることも調査で指摘されています。例えば、Salesforce AI Researchの責任者であるSilvio Savarese氏は、"Enterprise General Intelligence (EGI) "に関するブログ記事を発表しました。EGIとは、彼が提唱する概念で、企業のドメイン固有のニーズに合わせた、より高度なAIソリューションを指します。同氏はZDNETに対し、EGIを実現するための重要なステップの1つは、ドメイン固有の機能の評価に焦点を当てたベンチマークの必要性であると述べています。
こちらもお読みください: AnyMind Group Inc、自動化のためのAnyAIワークフローを開始
評価基準の開発に加え、OpenAIはチームと協力して、強化学習微調整(RFT)として知られる技術を使用して、3つの業界固有のユースケース向けに既存のモデルを改善します。OpenAIのチームは、参加企業にRFTの使用方法に関するガイダンスを提供し、企業はその後、モデルの導入方法を決定することができます。OpenAIによると、これらのモデルは大規模な展開の準備が整う見込みです。参加企業の最初のグループは、少数の新興企業で構成される予定です。彼らは、"実世界に影響を与える "ユースケースに取り組む予定です。これらの条件を満たす企業は、以下のサイトにあるフォームに記入して応募することができます。 オープンAI パイオニアプログラムのウェブページ。この記事は、海外のジフ・デイヴィス社発行の記事を朝日インタラクティブが日本向けに編集したものです。
ソース ヤフー