W

Wav2vec2 Large Xls R 300m Spanish Custom

tomascufaroによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceスペイン語データセットでファインチューニングした音声認識モデルで、評価セットで21.17%の単語誤り率を達成しました。
ダウンロード数 15
リリース時間 : 3/2/2022

モデル概要

このモデルはスペイン語に最適化された自動音声認識(ASR)モデルで、スペイン語音声をテキストに変換できます。

モデル特徴

スペイン語最適化
スペイン語音声データに特化してファインチューニングされており、スペイン語認識の精度が向上しています
wav2vec2-xls-rアーキテクチャ採用
Facebookが開発した大規模自己教師あり音声表現学習アーキテクチャを採用
比較的軽量
3億パラメータの規模で、性能を維持しながら計算リソース要件を低減

モデル能力

スペイン語音声認識
音声からテキストへの変換
音声コンテンツの書き起こし

使用事例

音声書き起こし
会議議事録
スペイン語の会議録音を自動的に文字記録に変換
評価セットで21.17%の単語誤り率を達成
音声アシスタント
スペイン語音声アシスタントアプリケーション向け音声認識コンポーネント
アクセシビリティアプリケーション
リアルタイム字幕生成
スペイン語動画コンテンツ向けリアルタイム字幕生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase