W

Wav2vec2 Large Xlsr 53 Swedish

KBLabによって開発
facebook/wav2vec2-large-xlsr - 53フレームワークに基づいて微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 30.51k
リリース時間 : 3/2/2022

モデル概要

これはスウェーデン語に特化して最適化された自動音声認識(ASR)モデルで、大規模なXLSR - 53アーキテクチャに基づき、スウェーデンのNSTディクテーションコーパスと一般音声データベースで微調整されています。

モデル特徴

高性能スウェーデン語認識
一般音声データベースのスウェーデン語テストセットで14.3%の単語誤り率と4.93%の文字誤り率を達成します。
多段階トレーニング
事前トレーニング、増分トレーニング、最終微調整の3つの段階で最適化されています。
言語モデル不要
追加の言語モデルのサポートなしで直接使用できます。

モデル能力

スウェーデン語音声認識
音声からテキストへの変換
音声処理

使用事例

音声書き起こし
放送内容の書き起こし
スウェーデン語の放送番組を自動的にテキストに書き起こします。
音声コマンド認識
スウェーデン語の音声コマンドを認識します。
音声支援技術
バリアフリーアプリケーション
聴覚障害者にリアルタイム字幕サービスを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase