W

Wav2vec2 Base Fi Voxpopuli V2 Finetuned

Finnish-NLPによって開発
facebook/wav2vec2-base-fi-voxpopuli-v2をファインチューニングしたフィンランド語自動音声認識モデル。276.7時間の注釈付きデータで訓練され、KenLM言語モデルデコードをサポート
ダウンロード数 64
リリース時間 : 5/14/2022

モデル概要

フィンランド語に最適化された音声テキスト変換モデルで、Common Voiceなどのテストセットで優れた性能を発揮

モデル特徴

効率的なファインチューニング
VoxPopuli V2事前訓練モデルを基に、276.7時間のフィンランド語データでファインチューニング
複数データセット対応
Common Voice、議会会議、放送コーパスなど6つのデータソースを統合
言語モデル強化
フィンランド語KenLM 5-gram言語モデルを組み合わせて認識精度を向上
軽量デプロイ
8-bit Adamオプティマイザをサポートし、リソース制約環境に適応

モデル能力

フィンランド語音声テキスト変換
短音声転写(≤20秒)
言語モデル付き音声認識

使用事例

音声転写
会議議録自動化
フィンランド議会会議録音をテキスト記録に変換
議会データセットでWER 5.93%
音声アシスタント開発
フィンランド語対応スマートデバイスの音声インタラクション基盤を提供
Common Voice 9.0でCER 1.40%
教育技術
言語学習ツール
フィンランド語発音評価システムに利用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase