K

Kotoba Whisper V2.2

kotoba-techによって開発
Whisperベースの日本語自動音声認識モデル、話者分離と句読点追加機能を統合
ダウンロード数 22.80k
リリース時間 : 10/18/2024

モデル概要

Kotoba-Whisper-v2.2は日本語自動音声認識(ASR)モデルで、Whisperアーキテクチャを基に開発され、話者分離と句読点追加の後処理機能を追加しています。

モデル特徴

話者分離
diarizers技術を統合し、異なる話者の音声内容を識別・分離可能
自動句読点
punctuators技術を使用して転写テキストに自動的に句読点を追加
効率的な推論
Flash Attention 2による加速をサポートし、GPU上の推論効率を向上

モデル能力

日本語音声認識
複数話者分離
自動句読点追加
長音声処理

使用事例

会議記録
複数話者会議転写
会議中の異なる発言者の音声内容を自動認識し、句読点付きの文字記録を生成
異なる話者を区別し、フォーマットされた会議記録を生成可能
インタビュー記録
インタビュー内容転写
インタビュー録音を文字に変換し、インタビュアーと回答者の発言を自動区別
話者識別子と句読点付きのインタビュー記録を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase