W

Whisper Small Tel

sagarchaparaによって開発
OpenAI Whisper-large-v2をテルグ語音声データセットでファインチューニングした音声認識モデル
ダウンロード数 17
リリース時間 : 2/27/2025

モデル概要

このモデルはテルグ語に最適化された自動音声認識(ASR)モデルで、Whisper-large-v2アーキテクチャを基にファインチューニングされており、テルグ語の音声から文字への変換タスクに特化しています。

モデル特徴

テルグ語最適化
テルグ語に特化してファインチューニングされており、この言語の認識精度を向上させています
大規模事前学習基盤
Whisper-large-v2の強力な音声認識能力を基にファインチューニングされています
エンドツーエンド音声認識
中間処理ステップなしで音声入力を直接テキスト出力に変換できます

モデル能力

テルグ語音声認識
音声からテキストへの変換
長時間音声の文字起こし

使用事例

音声文字起こし
テルグ語会議議事録
テルグ語の会議録音を自動的に文字記録に変換
単語誤り率約92.4%(さらなる最適化が必要)
メディア字幕生成
テルグ語動画コンテンツの自動字幕生成
音声アシスタント
テルグ語音声コマンド認識
テルグ語音声アシスタントアプリケーションのコマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase