W

Whisper Large V2 Kazakh

DrishtiSharmaによって開発
このモデルはOpenAIのWhisper Large V2をカザフ語Common Voice 11.0データセットでファインチューニングした音声認識モデルです
ダウンロード数 40
リリース時間 : 12/20/2022

モデル概要

カザフ語に最適化された自動音声認識(ASR)モデルで、Common Voice 11.0カザフ語テストセットで34.7%の単語誤り率を達成

モデル特徴

カザフ語最適化
カザフ語音声認識タスクに特化してファインチューニング
Whisperアーキテクチャ採用
OpenAI Whisper Large V2の強力な音声認識アーキテクチャを採用
オープンソースライセンス
Apache 2.0ライセンスで商用・研究利用可能

モデル能力

カザフ語音声認識
音声テキスト変換

使用事例

音声文字起こし
カザフ語音声文字起こし
カザフ語音声コンテンツをテキストに変換
テストセットで34.7%の単語誤り率を達成
音声アシスタント
カザフ語音声コマンド認識
カザフ語音声アシスタントや制御システムの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase