株式会社WEDは、日本語OCRエンジン「YomiToku(ヨミトク)」を開発・提供する株式会社エムリズムと協業し、現金還元型ショッピングアプリ「ONE(ワン)」で収集される実レシートデータに最適化した専用カスタムOCRモデルを共同開発しました。本取り組みを通じて、WEDは汎用モデル「YomiToku」の精度向上にも貢献します。なお、本取り組みの詳細は、本日、事例として公開する予定です。.
高精度OCRモデルの開発における最大の課題は、実環境を反映した学習データを確保することです。実世界の文書には、汎用的なデータセットでは十分に説明できないノイズや歪み、特殊なフォントが大量に含まれています。.
WEDの “ONE ”サービスは、毎日何百万枚ものレシート画像を蓄積しています。これらの画像には、印刷テキストや装飾フォントが混在しており、高度なOCR処理を必要とする実世界のデータが豊富に含まれています。.
こちらもお読みください: 東京都のAI活用推進は、日本のテック未来にとって重要な転換点を示唆
ML主義 とWEDは、相互にデータと技術を提供することでパートナーシップを確立し、以下の2つの共同イニシアティブを実施しています:
1.WED専用カスタムモデルの開発
WEDのレセプトデータをもとにYomiTokuをチューニングし、WED環境に最適化したカスタムOCRモデルを共同開発しました。チューニングの過程では、折り目や特殊なフォントなど、予想を超えるデータの多様性に遭遇し、実データならではの難しさと有用性を改めて実感しました。.
2.モデル結果
このイニシアチブで開発されたカスタムモデルは、特に次のようなものです。 水曜どうでしょう (Web Application Data)は、ONE上の領収書読み取り処理において、従来よりも精度の向上を実現しました。このモデルは、ONE上に日々蓄積される数百万枚という領収書の多様性と規模を生かしたもので、汎用OCRでは対応が難しかった条件(折れ、汚れ、装飾フォントなど)でも安定した読み取り性能を発揮し、サービス品質のさらなる向上を実現しています。.
この成果は、「よみとく」の汎用モデルの学習にも活用されています。この取り組みにより、特定分野では90%を超える文字認識精度を達成しています。.
ソース PRタイムズ


