K

Kotoba Whisper V2.1

由kotoba-tech開發
Kotoba-Whisper-v2.1 是一款基於 Whisper 的日語自動語音識別(ASR)模型,集成了額外的後處理棧,能夠自動添加標點符號。
下載量 2,589
發布時間 : 9/17/2024

模型概述

該模型專注於日語語音識別任務,通過整合 punctuators 庫實現標點符號的自動添加,提升了轉錄文本的可讀性。

模型特點

標點符號自動添加
通過整合 punctuators 庫,模型能夠自動為轉錄文本添加標點符號,提升文本可讀性。
優化的日語識別
專門針對日語語音識別進行優化,在多個日語數據集上表現優異。
流水線集成
後處理棧通過流水線無縫整合,簡化了使用流程。

模型能力

日語語音識別
自動標點添加
批量處理音頻

使用案例

語音轉錄
會議記錄轉錄
將日語會議錄音轉換為帶標點的文字記錄
CER 17.7(CommonVoice 8 測試集)
媒體內容字幕生成
為日語視頻內容自動生成帶標點的字幕
CER 15.4(JSUT Basic 5000 數據集)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase