W

Wav2vec2 Large Xlsr 53 Swedish

MehdiHosseiniMoghadamによって開発
これは、facebook/wav2vec2-large-xlsr-53モデルをベースに、スウェーデン語のCommon Voiceデータセットで微調整された自動音声認識(ASR)モデルです。
ダウンロード数 24
リリース時間 : 3/2/2022

モデル概要

このモデルは、スウェーデン語の音声認識タスクに特化しており、16kHzサンプリングの音声をテキストに変換することができます。

モデル特徴

スウェーデン語最適化
スウェーデン語に特化して微調整され、スウェーデン語音声認識の精度が向上しました
wav2vec2アーキテクチャに基づく
Facebookのwav2vec2 - large - xlsr - 53事前学習モデルをベースに採用しています
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力の処理をサポートしています

モデル能力

スウェーデン語音声認識
音声からテキストへの変換

使用事例

音声文字起こし
スウェーデン語音声文字起こし
スウェーデン語の音声内容をテキストに変換します
Common Voice sv - SEテストセットでのWERは41.39%です
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase