W

Wav2vec2 Xls R 300m Bp1 Es Eu

gttsehuによって開発
facebook/wav2vec2-xls-r-300mをファインチューニングしたバスク語自動音声認識モデルで、バスク議会データセットで3.67%の単語誤り率を達成
ダウンロード数 49
リリース時間 : 1/5/2024

モデル概要

これはバスク議会シーンに最適化された自動音声認識モデルで、XLS-Rアーキテクチャに基づき、特にバスク語の政治演説や会議記録シーンに適しています。

モデル特徴

低単語誤り率
バスク議会データセットでわずか3.67%の単語誤り率で、優れた性能を発揮
マルチGPU最適化
4GPU分散トレーニングを採用し、大規模データ処理を効率的にサポート
ドメイン適応
政治演説シーンに特化して最適化され、議会会議の特殊な語彙や表現方法に対応

モデル能力

バスク語音声からテキストへの変換
会議記録の自動生成
政治演説の認識

使用事例

政府会議記録
議会会議自動記録
バスク議会会議内容を自動転記し、文字記録を生成
精度96.33%(WER 3.67%)
音声アーカイブのデジタル化
歴史的会議録音の転記
保存されているバスク議会の歴史的音声を検索可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase