W

Wav2vec2 Large Xls R 300m Bg

anuragshasによって開発
facebook/wav2vec2-xls-r-300mをCommon Voice 8ブルガリア語データセットでファインチューニングした自動音声認識モデル
ダウンロード数 1,469
リリース時間 : 3/2/2022

モデル概要

これはブルガリア語に最適化された自動音声認識(ASR)モデルで、XLS-R-300Mアーキテクチャを基に、Mozilla Common Voice 8データセットでファインチューニングされています。

モデル特徴

マルチデータセット評価
Common Voice 8とロバスト音声コンペティションデータセットで包括的に評価
高性能
Common Voice 8テストセットで21.195%のWERと4.786%のCERを達成
最適化トレーニング
50エポックにわたる注意深いチューニングプロセスで、損失と誤り率を段階的に低減

モデル能力

ブルガリア語音声認識
音声からテキストへの変換
長時間音声処理(チャンク処理対応)

使用事例

音声文字起こし
音声メモ文字起こし
ブルガリア語の音声メモを検索可能なテキストに変換
約80%の精度 (WER 21.195%)
音声アシスタント
ブルガリア語音声アシスタントに音声認識機能を提供
音声分析
音声コンテンツ分析
ブルガリア語音声コンテンツを分析してキー情報を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase