K

Kotoba Whisper V1.0

由kotoba-tech開發
Kotoba-Whisper 是由 Asahi Ushio 和 Kotoba Technologies 合作開發的日語自動語音識別蒸餾版 Whisper 模型集合,比原版 large-v3 快 6.3 倍,同時保持相近的低錯誤率。
下載量 2,397
發布時間 : 4/14/2024

模型概述

日語自動語音識別模型,基於 Whisper large-v3 蒸餾優化,專注於日語語音轉錄任務。

模型特點

高效推理
比原版 Whisper large-v3 快 6.3 倍
高準確率
在多個日語測試集上 CER 和 WER 表現接近或優於原版模型
專注日語優化
專門針對日語語音特點進行訓練和優化
長音頻支持
支持順序和分塊兩種長音頻轉錄算法

模型能力

日語語音識別
短音頻轉錄
長音頻轉錄
帶時間戳的轉錄

使用案例

語音轉錄
日語會議記錄
將日語會議錄音自動轉錄為文字
CER 9.4-12.2,WER 56.6-64.3
日語播客字幕生成
為日語播客內容自動生成字幕
支持長音頻轉錄,可生成帶時間戳的字幕
語音數據標註
日語語音數據集標註
用於輔助日語語音數據集的標註工作
可作為預標註工具提高標註效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase