W

Whisper Telugu Base

vasista22によって開発
OpenAI Whisper-baseモデルをファインチューニングしたテルグ語自動音声認識(ASR)モデルで、複数の公開テルグ語データセットで訓練
ダウンロード数 279
リリース時間 : 12/20/2022

モデル概要

テルグ語音声からテキストへの変換タスク専用の自動音声認識モデルで、Whisperファインチューニングスプリントの一部

モデル特徴

複数データセット訓練
IIIT-H、ULCA、Shrutilipiなど6つの異なるテルグ語ASRコーパスで訓練
効率的なファインチューニング
OpenAI whisper-baseモデルを基にテルグ語の特徴に合わせてファインチューニング
高速推論サポート
whisper-jaxを使用した高速推論をサポートし、処理効率を向上

モデル能力

テルグ語音声認識
長音声処理(チャンク処理対応)
多分野音声文字起こし

使用事例

音声文字起こし
テルグ語会議議事録
テルグ語会議録音を文字記録に変換
単語誤り率(WER)13.39%
音声アシスタント開発
テルグ語音声アシスタントやチャットボットの開発に使用
教育応用
言語学習ツール
学習者がテルグ語の発音とリスニングを練習するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase