W

Whisper Telugu Large V2

vasista22によって開発
OpenAI Whisper-large-v2をファインチューニングしたテルグ語自動音声認識モデルで、複数の公開テルグ語データセットで訓練
ダウンロード数 156
リリース時間 : 12/20/2022

モデル概要

テルグ語に特化して最適化された音声認識モデルで、テルグ語音声を正確にテキストに変換可能

モデル特徴

テルグ語最適化
テルグ語に特化してファインチューニングされており、より正確な音声認識効果を提供
複数データセット訓練
CSTD IIIT-H、ULCA、Shrutilipiなどの公開テルグ語ASRコーパスで訓練
効率的な推論サポート
whisper-jaxを使用した高速推論をサポート

モデル能力

テルグ語音声認識
長音声処理(チャンク処理対応)
多分野音声転写

使用事例

音声転写
会議議事録
テルグ語会議録音を文字記録に変換
メディア字幕生成
テルグ語動画コンテンツの字幕生成
音声アシスタント
テルグ語音声インタラクション
テルグ語音声コマンド認識をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase