W

Wav2vec2 Xlsr Tatar

sammy786によって開発
このモデルはfacebook/wav2vec2-xls-r-1bをタタール語データセットでファインチューニングした自動音声認識モデルで、Common Voice 8データセットで16.87%の単語誤り率(WER)を達成しました。
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

タタール語自動音声認識用の事前学習モデルで、wav2vec2-xls-r-1bアーキテクチャを基にファインチューニング

モデル特徴

低単語誤り率
タタール語テストセットで16.87%の単語誤り率(WER)と3.64%の文字誤り率(CER)を達成
大規模事前学習モデルベース
facebook/wav2vec2-xls-r-1bモデルを基にファインチューニングし、強力な音声特徴抽出能力を継承
タタール語最適化
タタール語音声データに特化して最適化され、タタール語音声認識シナリオに適応

モデル能力

タタール語音声認識
音声からテキストへの変換
連続音声認識

使用事例

音声転写
タタール語音声転写
タタール語音声内容をテキストに変換
単語誤り率16.87%、文字誤り率3.64%
音声アシスタント
タタール語音声インタラクション
タタール語音声アシスタントに音声認識能力を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase