W

Wav2vec2 Xlsr 1b Finnish

aapotによって開発
Facebookのwav2vec2-xls-r-1bモデルを基に、フィンランド語自動音声認識(ASR)向けに微調整したバージョン。259.57時間のフィンランド語注釈付き音声データで訓練
ダウンロード数 18
リリース時間 : 3/2/2022

モデル概要

これはフィンランド語に最適化された自動音声認識モデルで、フィンランド語音声をテキストに変換するのに適しています。

モデル特徴

大規模事前学習基盤
43.6万時間の多言語音声データで事前学習されたwav2vec2-xls-r-1bモデル
フィンランド語最適化
259.57時間のフィンランド語注釈データで専門的に微調整
効率的な訓練
8-bit Adamオプティマイザーと混合精度訓練を使用
言語モデルサポート
KenLM言語モデルを組み合わせた改良版を提供

モデル能力

フィンランド語音声認識
短音声転写(最長20秒)
音声からテキストへ

使用事例

音声転写
会議議事録転写
フィンランド議会会議などの公式場面の音声をテキストに変換
議会データセットで良好な性能
音声アシスタント
フィンランド語音声アシスタントに音声認識能力を提供
音声分析
音声内容分析
フィンランド語放送やポッドキャストの内容を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase