K

Kotoba Whisper Bilingual V1.0

由kotoba-tech開發
Kotoba-Whisper-Bilingual是通過蒸餾Whisper模型訓練而成的集合,專為日語和英語語音識別及語音到文本翻譯任務設計。
下載量 782
發布時間 : 9/27/2024

模型概述

該模型支持日語和英語的自動語音識別(ASR)以及日語和英語之間的語音到文本翻譯任務。

模型特點

雙語支持
同時支持日語和英語的語音識別及互譯
高效推理
比原始Whisper large-v3模型快6.3倍
多任務能力
可同時執行語音識別和語音到文本翻譯任務

模型能力

日語語音識別
英語語音識別
日語到英語語音翻譯
英語到日語語音翻譯

使用案例

語音識別
日語語音轉錄
將日語語音轉換為文本
在CommonVoice 8日語測試集上CER為9.8
英語語音轉錄
將英語語音轉換為文本
在ESB數據集上表現良好
語音翻譯
日語到英語翻譯
將日語語音即時翻譯為英語文本
在CoVoST2(Ja->En)上WER為73.9
英語到日語翻譯
將英語語音即時翻譯為日語文本
在CoVoST2(En->Ja)上CER為69.1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase