データ分析ラボ 株式会社エヴィクサーは、総務省「インターネット上の虚偽・誤解を招く情報への対策に関する開発・実証事業」の採択事業の一環として実施した共同研究において、AIによる音声コンテンツ判定技術に関する研究成果を取りまとめましたので、お知らせいたします。.
本研究は、エヴィクサーの音響信号処理技術と当社のAI・データ解析技術を組み合わせることで、世代AIの高度化に伴い深刻な問題となっている虚偽・誤情報(ディープフェイクなど)対策の高度化を目的に実施したものです。.
研究結果の概要
本研究では、AIが生成する音声コンテンツの特徴を再現・分析し、合成音声を判定するための検証データとAIモデル検証環境を構築しました。.
こちらもお読みください: マイクロソフト、日本のAI変革を加速するために$100億円を拠出
主な業績
多様な音声生成モデルに対応した検証プラットフォームの構築
日本語を含む合成音声の分析に、,
- トータス
- XTTS(多言語モデル)
- クウェン3-TTS
最先端の音声生成モデルを調査・比較し、複数の生成方法について検証を行いました。.
特に、XTTSのような多言語・大規模学習型音声生成技術に対応することで、実際の生成AI環境に近い条件で検証を行いました。.
合成音声データの系統的生成と特徴分析
この研究では,
- 合成音声データ生成条件の整理と体系化
- オーディオ信号の分析(スペクトログラムなど)
- 自然音声からの構造差の抽出
この取り組みは、合成音声の特徴を定量的に捉えるために行いました。.
そこで、生成モデルに依存しない汎用的な判定技術の研究開発に取り組みました。.
ディープラーニングを用いた合成音声認識モデルの検証
発話の判定について、,
ディープラーニングモデルの研究と検証
- トレーニングデータセットの構築
- 判断の正確性を評価するプロセスの開発
この検証を行い、AI音声の特性を活かした判定モデルの有効性を一定程度確認しました。.
音響信号処理とAIの融合による技術の進歩
本研究では、エヴィクサーの音響信号処理技術と当社のAI技術を組み合わせ、エヴィクサーの合成音声認識システム(EAF)を強化するための検証支援を行いました。具体的には,
- 合成音声データの生成と各種生成モデルの動作検証
- 音声信号の特徴分析による合成音声と自然音声の違いの理解。.
- ディープラーニングモデルによる判定精度の検証と評価データセットの構築。.
私たちはこのイニシアチブを実施し、EAF(Expert Advisory Function:専門家諮問機能)評価の精度向上を目指した技術的知識の提供に努めました。.
ソース PRタイムズ


