W

Wav2vec2 Xlsr 1b Finnish Lm

aapotによって開発
Facebookのwav2vec2-xls-r-1bモデルを微調整したフィンランド語自動音声認識(ASR)モデルで、259.57時間のフィンランド語注釈データで訓練
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

このモデルはフィンランド語に最適化された音声テキスト変換モデルで、10億パラメータ規模のXLS-Rアーキテクチャを採用し、KenLM言語モデルと組み合わせて認識精度を向上

モデル特徴

大規模事前学習基盤
43.6万時間の多言語音声データで事前学習されたXLS-Rアーキテクチャ
高精度フィンランド語認識
Common Voiceテストセットで5.65% WERと1.2% CERを達成
言語モデル強化
専用に訓練されたフィンランド語KenLM 5-gram言語モデルを含む
効率的な訓練
8-bit Adamオプティマイザと混合精度訓練技術を使用

モデル能力

フィンランド語音声テキスト変換
短音声書き起こし(≤20秒)
言語モデルと組み合わせて認識精度向上

使用事例

音声書き起こし
会議議事録作成
フィンランド語会議録音を文字記録に変換
議会演説などの公式場面に適している
音声アシスタント
フィンランド語音声対話システムにASRサポートを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase