W

Wav2vec2 Swedish Common Voice

Developed by birgermoell
これはfacebook/wav2vec2-large-xlsr-53モデルをベースに、スウェーデン語のCommon Voiceデータセットで微調整された音声認識モデルで、学習データ量は402MBです。
Downloads 24
Release Time : 3/2/2022

Model Overview

このモデルはスウェーデン語の自動音声認識(ASR)タスクに使用され、16kHzサンプリングレートの音声入力をサポートします。

Model Features

スウェーデン語最適化
スウェーデン語に特化して微調整され、Common Voiceのスウェーデン語データセットで学習されました。
XLSRモデルベース
強力なwav2vec2-large-xlsr-53ベースモデルを基に構築されています。
軽量学習
わずか402MBの学習データを使用して微調整されました。

Model Capabilities

スウェーデン語音声認識
16kHzオーディオ処理

Use Cases

音声文字変換
スウェーデン語音声文字起こし
スウェーデン語の音声を文字に変換します。
Common VoiceテストセットでのWERは36.91%です。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase