リコー、図入り文書を読み取るLMMを開発

リコーは、日本企業の図表付き文書を読み取るマルチモーダル大規模言語モデルを開発したと発表。これは、アリババクラウドのQwen2.5-VL-32B-Instructモデルをベースに構築されたもの。今回の開発は、経済産業省とNEDOが推進するGENIACプロジェクト第2期の一環。リコーは、先に700億パラメータの基本モデルを無償で公開。リコーはこのモデルからのフィードバックをもとに、よりコンパクトで高性能なモデルを開発。実際のアプリケーションに導入しやすく、使いやすいように設計されています。また、より軽量なセットアップ用に4ビット量子化バージョンも提供しています。関連記事:pyscn-bot、LLM開発時代に向けたコード監査AIエージェントの提供を開始 このモデルを学習させるために、リコーは、...

コミュニティに参加する

コミュニティに参加する