W

Wav2vec2 Xlsr 300m Finnish Lm

aapotによって開発
Facebookのwav2vec2-xls-r-300mモデルをファインチューニングしたフィンランド語自動音声認識(ASR)モデル。275.6時間のフィンランド語データで訓練され、KenLM言語モデルとの連携デコードをサポート
ダウンロード数 15
リリース時間 : 3/2/2022

モデル概要

フィンランド語に最適化された音声テキスト変換モデルで、フィンランド語音声認識タスクに適しています

モデル特徴

多言語事前学習基盤
128言語をサポートするwav2vec2-xls-r-300mモデルを基にファインチューニング
言語モデル強化
専用に訓練されたフィンランド語KenLM 5-gram言語モデルを含み、認識精度を向上
効率的な訓練
8-bit Adamオプティマイザと混合精度訓練技術を採用
包括的なデータカバレッジ
議会記録、放送、Common Voiceなど多様なフィンランド語データソースを使用

モデル能力

フィンランド語音声認識
長音声のチャンク処理
言語モデル付きデコード

使用事例

音声文字起こし
議会議事録
フィンランド議会の会議音声を文字記録に変換
公式スピーチスタイルの認識に最適
放送コンテンツ文字起こし
フィンランド語放送番組の文字変換
音声アシスタント
フィンランド語音声コマンド認識
フィンランド語対応スマートデバイスの音声制御に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase