W

Wav2vec2 Common Voice Tr Demo

birgermoellによって開発
このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE SV-SEデータセットでファインチューニングした自動音声認識(ASR)モデルで、スウェーデン語音声認識をサポートします。
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

これはスウェーデン語向けの自動音声認識モデルで、wav2vec2アーキテクチャに基づき、Common Voiceデータセットでファインチューニングされており、スウェーデン語音声をテキストに変換するために使用できます。

モデル特徴

スウェーデン語音声認識
スウェーデン語に特化して最適化された音声認識能力
wav2vec2アーキテクチャ採用
facebookのwav2vec2-large-xlsr-53をベースモデルとして採用
Common Voiceデータセットでファインチューニング
Common Voice SV-SEデータセットでファインチューニングを実施

モデル能力

スウェーデン語音声からテキストへの変換
自動音声認識

使用事例

音声書き起こし
スウェーデン語音声転写
スウェーデン語音声コンテンツを編集可能なテキスト形式に変換
単語誤り率(WER)は0.3811
音声アシスタント
スウェーデン語音声コマンド認識
スウェーデン語音声アシスタントの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase