W

Wav2vec LnNor IPA Ft

由MultiBridge開發
基於wav2vec2-base微調的音素識別模型,支持英語語音轉國際音標(IPA)
下載量 16
發布時間 : 3/2/2025

模型概述

該模型通過對TIMIT和LnNor數據集的微調開發,專門用於音素識別任務,預測結果採用國際音標(IPA)表示。

模型特點

多數據集微調
結合TIMIT和LnNor數據集進行訓練,增強模型泛化能力
國際音標輸出
直接輸出國際音標(IPA)表示,便於語音學研究
預訓練特徵保留
凍結編碼器保留了wav2vec2-base的有用預學習特徵

模型能力

英語音素識別
語音轉音標
自動音標轉寫

使用案例

語音處理
自動音標轉寫
將原始語音轉換為音素序列
語音處理組件
作為語音處理流程中的組件或原型開發
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase