W

Whisper Medium Vaani Telugu

ARTPARK-IIScによって開発
OpenAI Whisper-smallアーキテクチャを基にしたテルグ語自動音声認識モデル。ARTPARK-IIScチームによりインド言語向けに最適化
ダウンロード数 26
リリース時間 : 12/1/2024

モデル概要

このモデルはWhisper-smallのバリエーションで、テルグ語に特化して最適化されており、テルグ語音声をテキストに変換するために使用されます

モデル特徴

テルグ語最適化
テルグ語の音声特性に特化して最適化された自動音声認識モデル
Whisperアーキテクチャ採用
OpenAI Whisper-smallの成熟したTransformerアーキテクチャを採用し、安定した音声認識能力を有する
16kHzオーディオサポート
標準16kHzサンプリングレートのオーディオ入力をサポートし、Whisperモデル仕様に準拠

モデル能力

テルグ語音声認識
音声からテキストへの変換
自動音声文字起こし

使用事例

音声文字起こし
テルグ語会議議事録
テルグ語会議録音を自動的に文字記録に変換
議事録作成効率を向上させ、手作業による文字起こし時間を削減
音声アシスタント開発
テルグ語対応音声アシスタントアプリケーションの開発に使用
テルグ語音声コマンド認識を実現
教育
言語学習ツール
学習者がテルグ語発音の正確性を確認するのを支援
即時の音声フィードバックを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase