K

Kotoba Whisper V1.1

kotoba-techによって開発
Kotoba-Whisper-v1.1はWhisperをベースにした日本語自動音声認識モデルで、句読点とタイムスタンプ処理機能を追加しています。
ダウンロード数 476
リリース時間 : 4/29/2024

モデル概要

これは日本語自動音声認識(ASR)モデルで、Whisperアーキテクチャを基に、特に日本語音声転写に最適化され、句読点追加とタイムスタンプ処理機能を統合しています。

モデル特徴

句読点処理
punctuatorsライブラリを統合し、転写テキストに自動的に句読点を追加できます。
タイムスタンプ処理
stable-tsライブラリを使用してタイムスタンプの精度を向上させました。
日本語最適化
特に日本語音声認識向けに最適化されています。
効率的な推論
オリジナルのWhisperモデルに比べて推論速度が向上しています。

モデル能力

日本語音声認識
自動句読点追加
タイムスタンプ生成
長音声処理

使用事例

音声転写
会議議事録転写
日本語会議録音を句読点付きテキスト記録に変換します。
オリジナルWhisperモデルより優れた精度
ポッドキャスト転写
日本語ポッドキャストコンテンツをタイムスタンプ付きテキストに転写します。
長音声処理をサポート
音声分析
音声コンテンツ分析
日本語音声コンテンツのキーワードとテーマを分析します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase