W

Wav2vec2 Lv 60 Espeak Cv Ft

由facebook開發
該模型是基於Wav2Vec2-Large-LV60預訓練模型,在CommonVoice數據集上進行微調,用於多語言音素識別。
下載量 18.77k
發布時間 : 3/2/2022

模型概述

該模型主要用於多語言的音素識別任務,能夠將語音輸入轉換為音素標籤。需要配合音素到單詞的映射詞典使用。

模型特點

多語言支持
支持多種語言的音素識別
基於CommonVoice微調
在CommonVoice數據集上進行微調,提高了識別準確性
音素級別識別
輸出為音素標籤,需要配合詞典轉換為單詞

模型能力

語音識別
音素識別
多語言處理

使用案例

語音轉寫
多語言語音轉錄
將多種語言的語音轉換為音素標籤
可進一步轉換為文字
語音學研究
音素分析
用於分析不同語言的音素分佈和特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase