K

Kotoba Whisper V2.0

由kotoba-tech開發
Kotoba-Whisper是由Asahi Ushio與Kotoba Technologies合作開發的日語自動語音識別蒸餾模型,基於Whisper large-v3蒸餾而來,推理速度提升6.3倍。
下載量 8,108
發布時間 : 9/17/2024

模型概述

日語自動語音識別模型,通過知識蒸餾技術優化Whisper large-v3模型,在保持相近錯誤率的同時顯著提升推理速度。

模型特點

高效推理
相比原版Whisper large-v3,推理速度提升6.3倍
高性能
在ReazonSpeech等日語數據集上CER/WER優於原版模型
大規模訓練
使用超過720萬條日語語音-文本對進行訓練

模型能力

日語語音轉文本
長音頻分段處理
支持Flash Attention 2加速

使用案例

語音轉錄
電視節目字幕生成
處理日本電視節目音頻生成準確字幕
在ReazonSpeech測試集上CER 11.6/WER 55.6
語音助手
為日語語音助手提供快速準確的語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase