K

Kotoba Whisper V1.0

kotoba-techによって開発
Kotoba-Whisperは、Asahi UshioとKotoba Technologiesが共同開発した日本語自動音声認識の蒸留版Whisperモデルセットで、オリジナルのlarge-v3に比べて6.3倍高速でありながら、同等の低エラー率を維持しています。
ダウンロード数 2,397
リリース時間 : 4/14/2024

モデル概要

日本語自動音声認識モデルで、Whisper large-v3を蒸留最適化し、日本語音声文字起こしタスクに特化しています。

モデル特徴

効率的な推論
オリジナルWhisper large-v3より6.3倍高速
高精度
複数の日本語テストセットでCERとWERがオリジナルモデルに近いか優れている
日本語最適化
日本語音声の特徴に特化して訓練・最適化
長音声対応
順次処理とチャンク処理の2つの長音声文字起こしアルゴリズムをサポート

モデル能力

日本語音声認識
短音声文字起こし
長音声文字起こし
タイムスタンプ付き文字起こし

使用事例

音声文字起こし
日本語会議議事録
日本語会議録音を自動で文字に起こす
CER 9.4-12.2、WER 56.6-64.3
日本語ポッドキャスト字幕生成
日本語ポッドキャストコンテンツの自動字幕生成
長音声文字起こしに対応し、タイムスタンプ付き字幕を生成可能
音声データアノテーション
日本語音声データセットアノテーション
日本語音声データセットのアノテーション作業を補助
事前アノテーションツールとして効率向上に寄与
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase