K

Kotoba Whisper V2.1

kotoba-techによって開発
Kotoba-Whisper-v2.1 は Whisper をベースにした日本語自動音声認識(ASR)モデルで、追加の後処理スタックを統合し、句読点を自動的に追加できます。
ダウンロード数 2,589
リリース時間 : 9/17/2024

モデル概要

このモデルは日本語音声認識タスクに特化しており、punctuators ライブラリを統合することで句読点の自動追加を実現し、転写テキストの可読性を向上させています。

モデル特徴

句読点自動追加
punctuators ライブラリを統合することで、モデルは転写テキストに自動的に句読点を追加し、テキストの可読性を向上させます。
最適化された日本語認識
日本語音声認識に特化して最適化されており、複数の日本語データセットで優れた性能を発揮します。
パイプライン統合
後処理スタックがパイプラインでシームレスに統合されており、使用プロセスを簡素化しています。

モデル能力

日本語音声認識
自動句読点追加
音声ファイルのバッチ処理

使用事例

音声転写
会議議事録の転写
日本語の会議録音を句読点付きの文字記録に変換
CER 17.7(CommonVoice 8 テストセット)
メディアコンテンツの字幕生成
日本語動画コンテンツに句読点付きの字幕を自動生成
CER 15.4(JSUT Basic 5000 データセット)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase