W

Wav2vec2 Xls R 300m Japanese

由vitouphy開發
這是一個基於facebook/wav2vec2-xls-r-300m微調的日語自動語音識別模型,專門用於將日語音頻轉錄為平假名文本。
下載量 29
發布時間 : 3/2/2022

模型概述

該模型是在mozilla-foundation/common_voice_8_0數據集上微調的日語語音識別模型,特別優化了將日語語音轉換為平假名的能力。

模型特點

平假名轉錄優化
專門優化了將日語語音轉換為平假名的能力,使用pykakasi將所有文本轉換為平假名
多數據集驗證
在Common Voice 8和魯棒語音事件等多個數據集上進行了驗證
語言模型支持
支持使用語言模型(LM)來提高識別準確率

模型能力

日語語音識別
音頻轉文本
平假名轉錄

使用案例

語音轉錄
日語語音轉文字
將日語語音內容轉換為平假名文本
CER 0.2754 (Common Voice 8測試集)
語音內容分析
分析日語語音內容並轉換為可處理的文本格式
CER 0.2487 (魯棒語音事件開發集)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase