X

Xls R 1B Te

chmanojによって開発
facebook/wav2vec2-xls-r-1bをベースに、OPENSLR_SLR66 - NAデータセットで微調整したテルグ語音声認識モデルで、自動音声認識タスクをサポートします。
ダウンロード数 18
リリース時間 : 3/2/2022

モデル概要

このモデルはテルグ語に最適化された自動音声認識システムで、XLS - Rアーキテクチャに基づき、OpenSLRのSLR66データセットで微調整され、テルグ語の音声をテキストに変換するタスクに適しています。

モデル特徴

高精度なテルグ語認識
テストセットで20.624%の単語誤り率(WER)と3.979%の文字誤り率(CER)を達成しました。
大規模事前学習の基礎
facebook/wav2vec2-xls-r-1bモデルをベースに微調整され、大規模事前学習モデルの強力な特徴抽出能力を引き継いでいます。
言語モデルデコードをサポート
言語モデルを統合することで、認識精度をさらに向上させることができ、WERが26.14%から20.69%に改善されます。

モデル能力

テルグ語音声認識
音声をテキストに変換
言語モデルの統合をサポート

使用事例

音声文字起こし
テルグ語の音声文字起こし
テルグ語の音声内容をテキストに変換します。
テストセットで20.624%のWERを達成しました。
音声アシスタント
テルグ語の音声インタラクション
テルグ語のユーザーに音声インタラクション機能を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase