P

Psst Base Rep

由birgermoell開發
基於Wav2vec2-small架構在PSST數據集上訓練的語音識別基線模型
下載量 30
發布時間 : 4/1/2022

模型概述

該模型是Wav2vec2-small架構在PSST數據集上的復現版本,主要用於語音識別任務,支持音素和字級別的識別。

模型特點

高效語音識別
基於Wav2vec2-small架構,提供高效的語音識別能力。
音素和字級別識別
支持音素錯誤率(PER)和字錯誤率(FER)的評估。

模型能力

語音識別
音素識別
字級別識別

使用案例

語音轉寫
語音轉文字
將語音內容轉換為文字,適用於會議記錄、語音筆記等場景。
字錯誤率(FER): 10.4%
語音分析
音素分析
分析語音中的音素組成,適用於語音學研究或語音訓練。
音素錯誤率(PER): 23.1%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase