W

Wav2vec2 Swedish Common Voice

birgermoellによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルをベースに、スウェーデン語のCommon Voiceデータセットで微調整された音声認識モデルで、学習データ量は402MBです。
ダウンロード数 24
リリース時間 : 3/2/2022

モデル概要

このモデルはスウェーデン語の自動音声認識(ASR)タスクに使用され、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

スウェーデン語最適化
スウェーデン語に特化して微調整され、Common Voiceのスウェーデン語データセットで学習されました。
XLSRモデルベース
強力なwav2vec2-large-xlsr-53ベースモデルを基に構築されています。
軽量学習
わずか402MBの学習データを使用して微調整されました。

モデル能力

スウェーデン語音声認識
16kHzオーディオ処理

使用事例

音声文字変換
スウェーデン語音声文字起こし
スウェーデン語の音声を文字に変換します。
Common VoiceテストセットでのWERは36.91%です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase