W

Wav2vec2 Xlsr 1b Finnish Lm V2

Finnish-NLPによって開発
フィンランド語に最適化された自動音声認識モデル、Facebookのwav2vec2-xls-r-1bモデルをファインチューニング
ダウンロード数 3,869
リリース時間 : 3/27/2022

モデル概要

これはフィンランド語自動音声認識(ASR)タスク向けに最適化された音響モデルで、275.6時間のフィンランド語注釈付き音声データでファインチューニングされ、フィンランド語KenLM言語モデルをデコード用に含んでいます

モデル特徴

高性能フィンランド語認識
Common Voice 7テストセットで4.09% WERと0.88% CERの優れた性能を達成
大規模事前学習基盤
43.6万時間の多言語データで事前学習されたwav2vec2-xls-r-1bモデルを基に構築
統合言語モデル
フィンランド語に特化して最適化された5-gram KenLM言語モデルを含み、デコード効果を向上
複数データセット学習
Common Voice、フィンランド議会、VoxPopuliなど複数のフィンランド語音声データセットを統合

モデル能力

フィンランド語音声からテキストへ
短い音声処理(最長20秒)
音声認識タスクをサポート

使用事例

音声文字起こし
議会議事録
フィンランド議会の会議録音を文字記録に変換
正式な場面のフィンランド語音声に適している
音声アシスタント
フィンランド語音声アシスタントにASR機能を提供
標準フィンランド語を良好に認識
音声分析
音声内容分析
フィンランド語放送やポッドキャストの内容を分析
正式なメディアコンテンツの音声認識に適している
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase