X

Xls R 2B Te

chmanojによって開発
これはfacebook/wav2vec2-xls-r-2bモデルをファインチューニングしたテルグ語自動音声認識(ASR)モデルで、OpenSLR SLR66データセットでトレーニングされました
ダウンロード数 20
リリース時間 : 3/2/2022

モデル概要

このモデルはテルグ語の音声認識タスク専用で、テルグ語音声をテキストに変換できます

モデル特徴

高精度テルグ語認識
テストセットで0.51の単語誤り率(WER)と0.097の文字誤り率(CER)を達成
XLS-Rアーキテクチャベース
facebookのwav2vec2-xls-r-2bをベースモデルとしてファインチューニング
公開データセットでトレーニング
OpenSLR SLR66公開データセットを使用してトレーニング

モデル能力

テルグ語音声認識
音声からテキストへの変換
ロバスト音声処理

使用事例

音声文字起こし
テルグ語会議議事録
テルグ語会議録音を自動的に文字起こし
約90.3%の精度(1-CERベース)
音声アシスタント
テルグ語ユーザー向け音声インタラクション機能を提供
教育
言語学習支援
学習者のテルグ語発音精度チェックを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase