X

Xls R 300m Sv

hf-testによって開発
facebook/wav2vec2-xls-r-300mをベースに、スウェーデン語データセットで微調整した自動音声認識モデル
ダウンロード数 28
リリース時間 : 3/2/2022

モデル概要

これはスウェーデン語に最適化された自動音声認識(ASR)モデルで、XLS-R-300mアーキテクチャに基づき、Common Voice 7スウェーデン語データセットで微調整され、スウェーデン語の音声をテキストに変換できます。

モデル特徴

スウェーデン語最適化
スウェーデン語の音声認識に特化して微調整され、スウェーデン語データセットで優れた性能を発揮します。
複数データセット検証
Common Voice 7とロバスト音声コンテストデータセットの両方で評価されました。
言語モデル統合のサポート
言語モデルを組み合わせることで、認識精度をさらに向上させることができます。

モデル能力

スウェーデン語音声認識
長時間オーディオ処理(ブロック処理のサポート)
高精度のテキスト転写

使用事例

音声転写
スウェーデン語音声をテキストに変換
スウェーデン語の音声内容をテキストに変換します。
テストWER 16.98(CV7)、27.01(ロバストコンテスト)
音声アシスタント
スウェーデン語音声命令認識
スウェーデン語の音声アシスタントまたは制御システムに使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase