W

Wav2vec2 Large Pitch Recognition

由vumichien開發
基於facebook/wav2vec2-large-xlsr-53在日語口音數據集上微調的語音識別模型
下載量 15
發布時間 : 3/2/2022

模型概述

該模型專注於日語口音的自動語音識別任務,能夠識別帶有口音的日語語音輸入

模型特點

日語口音識別
專門針對日語口音優化的語音識別能力
基於Wav2Vec2架構
採用先進的Wav2Vec2架構,具有強大的語音特徵提取能力
16kHz採樣率支持
支持16kHz採樣率的語音輸入

模型能力

日語語音識別
口音語音處理
自動語音轉文本

使用案例

語音轉寫
日語口音語音轉寫
將帶有地方口音的日語語音轉換為文本
詞錯誤率15.82%
語音助手
口音友好的語音助手
為不同地區的日語使用者提供更準確的語音交互
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase