W

Wav2vec2 Xlsr 300m Finnish Lm

Finnish-NLPによって開発
facebook/wav2vec2-xls-r-300mをファインチューニングしたフィンランド語自動音声認識モデル。275.6時間のフィンランド語注釈データで訓練され、KenLM言語モデルとの連携使用をサポート。
ダウンロード数 28.39k
リリース時間 : 3/28/2022

モデル概要

フィンランド語に最適化された自動音声認識モデルで、フィンランド語音声をテキストに変換するタスクに適しています。

モデル特徴

多様なトレーニングデータ
Common Voice、議会録音、放送コーパスなど275.6時間のフィンランド語データを統合し、様々な音声シナリオをカバー。
言語モデル強化
音声テキストとウィキペディアで訓練されたフィンランド語KenLM 5-gram言語モデルを提供し、認識精度を向上。
効率的なトレーニング
8-bit Adamオプティマイザと混合精度トレーニングを採用し、V100 GPUでファインチューニングを完了。

モデル能力

フィンランド語音声認識
長音声チャンク処理
ドメイン適応(ファインチューニング必要)

使用事例

音声文字起こし
議会録音転写
フィンランド議会録音内容の自動文字起こしに適しています
議会データを中心としたテストセットでWER 8.16%
放送コンテンツ字幕生成
フィンランド語放送番組の自動字幕生成
放送コーパステストセットでCER 1.97%
教育技術
言語学習支援
フィンランド語学習者の発音評価とテキストフィードバックに使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase