W

Wav2vec2 Large Xlsr 53 Eu

pcuenqによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたバスク語自動音声認識モデルで、Common Voiceバスク語テストセットで15.34%の単語誤り率(WER)を達成。
ダウンロード数 1,378
リリース時間 : 3/2/2022

モデル概要

このモデルはバスク語に最適化された自動音声認識(ASR)システムで、大規模事前学習済みXLSR-53アーキテクチャをファインチューニングしており、バスク語音声からテキストへの変換タスクに適しています。

モデル特徴

低単語誤り率
Common Voiceバスク語テストセットで15.34%のWERを達成し、優れた性能を発揮
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
効率的なファインチューニング
大規模事前学習モデルを基にした効率的なデータ利用
標準インターフェース
Hugging Face Transformersライブラリと互換性があり、容易に統合可能

モデル能力

バスク語音声認識
リアルタイム音声テキスト変換
長音声処理

使用事例

音声文字起こし
バスク語会議議事録
バスク語会議録音を自動的に文字記録に変換
約85%の精度(WERに基づく推定)
音声アシスタント
バスク語音声アシスタント向け音声認識機能を提供
教育技術
言語学習アプリ
バスク語学習アプリのための発音評価システム
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase