W

Whisper Turbo Ksc2

abilmansplusによって開発
これはWhisper large-v3-turboモデルをベースに、約1000時間のカザフ語音声データで微調整された自動音声認識モデルで、テストセットの文字誤り率は9.16%です。
ダウンロード数 1,740
リリース時間 : 5/1/2025

モデル概要

カザフ語に特化して最適化された音声認識モデルで、カザフ語の音声内容を正確に文字起こしできます。

モデル特徴

高精度なカザフ語認識
1000時間のカザフ語データで微調整され、テストセットの文字誤り率はわずか9.16%です。
長い音声の処理能力
ブロック分割処理により、30秒を超える長い音声の文字起こしをサポートします。
Whisperをベースに最適化
Whisper large-v3-turboモデルをベースに微調整され、その優れた特性を引き継いでいます。

モデル能力

カザフ語音声認識
長い音声の文字起こし
高品質な音声からテキストへの変換

使用事例

音声文字起こし
カザフ語会議記録
カザフ語の会議内容を自動的に文字起こしします。
正確率90.84%
メディアコンテンツの字幕生成
カザフ語のビデオコンテンツに自動的に字幕を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase