W

Wav2vec2 Xlsr 1b Finnish V2

aapotによって開発
facebook/wav2vec2 - xls - r - 1bをベースに微調整されたフィンランド語自動音声認識モデルで、275.6時間のフィンランド語アノテーションデータを使用して訓練されました。
ダウンロード数 15
リリース時間 : 3/2/2022

モデル概要

フィンランド語に最適化された音声文字変換モデルで、短い音声ファイルの文字起こしタスクに適しています。

モデル特徴

大規模事前学習の基礎
43.6万時間の多言語音声で事前学習された10億パラメータモデルを微調整しました。
効率的な微調整
8ビットAdamオプティマイザを使用してパラメータを効率的に微調整しました。
多ソースの訓練データ
議会録音、ラジオ放送、Common Voiceなど6つのフィンランド語データセットを統合しました。
低文字誤り率
Common Voiceテストセットで1.65%の文字誤り率を達成しました。

モデル能力

フィンランド語音声認識
短い音声ファイルの文字起こし
音声内容の文字変換

使用事例

音声文字起こし
会議記録の自動化
フィンランド語の会議録音を文字記録に変換します。
単語誤り率9.73%(言語モデルなし)
メディアコンテンツの字幕生成
フィンランド語のビデオ/ラジオ番組に字幕を生成します。
文字誤り率1.65%
音声アシスタント
フィンランド語音声命令の認識
フィンランド語対応のスマートデバイスの音声インタラクションをサポートします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase