Whisper Telugu Base
W
Whisper Telugu Base
vasista22によって開発
OpenAI Whisper-baseモデルをファインチューニングしたテルグ語自動音声認識(ASR)モデルで、複数の公開テルグ語データセットで訓練
ダウンロード数 279
リリース時間 : 12/20/2022
モデル概要
テルグ語音声からテキストへの変換タスク専用の自動音声認識モデルで、Whisperファインチューニングスプリントの一部
モデル特徴
複数データセット訓練
IIIT-H、ULCA、Shrutilipiなど6つの異なるテルグ語ASRコーパスで訓練
効率的なファインチューニング
OpenAI whisper-baseモデルを基にテルグ語の特徴に合わせてファインチューニング
高速推論サポート
whisper-jaxを使用した高速推論をサポートし、処理効率を向上
モデル能力
テルグ語音声認識
長音声処理(チャンク処理対応)
多分野音声文字起こし
使用事例
音声文字起こし
テルグ語会議議事録
テルグ語会議録音を文字記録に変換
単語誤り率(WER)13.39%
音声アシスタント開発
テルグ語音声アシスタントやチャットボットの開発に使用
教育応用
言語学習ツール
学習者がテルグ語の発音とリスニングを練習するのを支援
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98