W

Wav2vec2 Large Robust Pronounciation Evaluation

由hafidikhsan開發
基於facebook/wav2vec2-large-robust微調的發音評估模型,用於語音質量評估任務
下載量 242
發布時間 : 6/26/2023

模型概述

該模型是基於wav2vec2-large-robust架構微調的發音評估模型,主要用於評估語音發音質量,可計算準確率、F1值等指標

模型特點

高精度發音評估
在測試集上達到72%的準確率和F1值
基於wav2vec2-large-robust架構
利用強大的預訓練語音表示能力進行微調
多指標評估
支持準確率、F1值、精確率和召回率等多種評估指標

模型能力

語音質量評估
發音準確性分析
語音特徵提取

使用案例

語言學習
外語發音評估
用於評估外語學習者的發音準確性
可提供72%的評估準確率
語音質量檢測
語音合成質量評估
評估TTS系統生成的語音質量
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase