K

Kotoba Whisper V2.2

由kotoba-tech開發
基於Whisper的日語自動語音識別模型,集成說話人分離和標點符號添加功能
下載量 22.80k
發布時間 : 10/18/2024

模型概述

Kotoba-Whisper-v2.2是一個日語自動語音識別(ASR)模型,基於Whisper架構開發,增加了說話人分離和標點符號添加的後處理功能。

模型特點

說話人分離
集成diarizers技術,能夠識別並分離不同說話人的語音內容
自動標點
使用punctuators技術為轉錄文本自動添加標點符號
高效推理
支持Flash Attention 2加速,提高GPU上的推理效率

模型能力

日語語音識別
多說話人分離
自動標點添加
長音頻處理

使用案例

會議記錄
多說話人會議轉錄
自動識別會議中不同發言人的語音內容並生成帶標點的文字記錄
可區分不同說話人並生成格式化的會議記錄
訪談記錄
訪談內容轉錄
將訪談錄音轉換為文字,自動區分採訪者和受訪者的發言
生成帶說話人標識和標點的訪談記錄
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase