W

Wav2vec2 Large Voxrex Swedish

KBLabによって開発
VoxRex大型モデルを微調整したスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 101.28k
リリース時間 : 3/2/2022

モデル概要

このモデルは、スウェーデン語用に最適化された自動音声認識(ASR)システムで、FacebookのWav2vec 2.0アーキテクチャに基づき、スウェーデン語のラジオ、NST、および汎用音声データセットで微調整されています。

モデル特徴

高性能スウェーデン語認識
NST+汎用音声テストセットで2.5%のWER、汎用音声テストセットで8.49%のWERを達成します。
言語モデル強化のサポート
4 - gram言語モデルを使用することで、WERを8.49%から7.37%に低下させることができます。
複数データセットによる訓練
スウェーデン語のラジオ、NST、および汎用音声データセットを組み合わせて訓練しています。

モデル能力

スウェーデン語音声認識
16kHzオーディオ処理
言語モデルなしでの直接使用

使用事例

音声から文字への変換
ラジオ内容の文字起こし
スウェーデン語のラジオ内容を自動的に文字に変換します。
ラジオデータセットで優れた性能を発揮します。
音声アシスタント
スウェーデン語の音声アシスタントに音声認識機能を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase