W

Wav2vec2 Large Xlsr 53 Spanish

LuisG07によって開発
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたスペイン語自動音声認識(ASR)モデルで、Common Voiceスペイン語データセットで訓練され、16kHzのサンプリングレートの音声入力をサポートします。
ダウンロード数 50
リリース時間 : 3/2/2022

モデル概要

これは、XLSR - 53アーキテクチャをベースに微調整された、スペイン語自動音声認識(ASR)用のWav2Vec2モデルで、スペイン語の音声をテキストに変換することができます。

モデル特徴

高精度認識
Common Voiceスペイン語テストセットで、8.82%の単語誤り率(WER)と2.58%の文字誤り率(CER)を達成します。
言語モデル強化
言語モデルを組み合わせると、単語誤り率をさらに6.27%に、文字誤り率を2.06%に下げることができます。
16kHzサンプリングレートのサポート
16kHzのサンプリングレートの音声入力を処理するために特別に最適化されています。
オープンソースライセンス
Apache - 2.0ライセンスを採用しており、商用および研究用途での使用が許可されています。

モデル能力

スペイン語音声認識
音声からテキストへの変換
自動音声文字起こし

使用事例

音声文字起こし
音声コンテンツの文字起こし
スペイン語の音声コンテンツを自動的にテキストに変換します。
高い精度の文字起こし結果
音声アシスタント
スペイン語音声コマンド認識
スペイン語の音声アシスタントまたはコマンド制御システムを構築するために使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase