W

Wav2vec2 Large Xlsr 53 Telugu

anuragshasによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたテルグ語音声認識モデルで、OpenSLR SLR66データセットを使用してトレーニング
ダウンロード数 44.24k
リリース時間 : 3/2/2022

モデル概要

これはテルグ語向けの自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づいており、テルグ語音声をテキストに変換するのに適しています。

モデル特徴

テルグ語専用
テルグ語に特化して最適化された音声認識モデル
XLSR事前学習モデルベース
大規模なクロスランゲージ音声表現学習(XLSR)の事前学習知識を活用
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

モデル能力

テルグ語音声認識
16kHz音声処理

使用事例

音声からテキストへ
テルグ語音声文字起こし
テルグ語音声コンテンツをテキストに変換
OpenSLRテストセットで44.98% WERを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase