J

Japanese Wav2vec2 Large Rs35kh

由reazon-research開發
基於wav2vec 2.0 Large架構,在大型日語ASR語料庫ReazonSpeech v2.0上微調而成的日語自動語音識別模型
下載量 244
發布時間 : 11/29/2024

模型概述

這是一個高性能的日語自動語音識別(ASR)模型,專門針對日語語音識別任務進行了優化,具有較低的字符錯誤率和良好的長語音識別能力。

模型特點

高性能日語識別
在多個測試集上表現出色,平均字符錯誤率(CER)僅為16.25%
長語音處理能力
特別優化了長語音識別性能,在JSUT-BOOK測試集上CER僅為30.98%
基於大規模數據集訓練
在ReazonSpeech v2.0大型日語ASR語料庫上微調
支持bfloat16和Flash Attention
支持bfloat16數據類型和Flash Attention 2優化,提高推理效率

模型能力

日語語音識別
長語音處理
即時語音轉文字

使用案例

語音轉文字
日語會議記錄
將日語會議錄音自動轉換為文字記錄
平均字符錯誤率16.25%
日語播客轉錄
將日語播客內容轉錄為文字
長語音識別CER 30.98%
語音助手
日語語音指令識別
用於日語語音助手或智能設備的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase