X

Xlsr Timit A0

由KoelLabs開發
基於XLSR預訓練模型在TIMIT英語語料庫上微調的音位轉錄模型,用於將英語音頻轉換為音位表徵。
下載量 17
發布時間 : 12/1/2024

模型概述

本模型專門用於英語音頻的音位級自動語音識別(ASR),可將語音信號轉換為國際音標(IPA)符號序列。

模型特點

高精度音位轉錄
在TIMIT測試集上達到0.14的平均字符錯誤率(CER)
專業語音學標註
輸出為國際音標(IPA)符號,適合語音學研究
輕量級微調
基於預訓練XLSR模型進行高效微調,只需40個訓練輪次

模型能力

英語語音識別
音位級轉錄
國際音標轉換

使用案例

語音學研究
音位分析
自動生成語音樣本的音位標註
提供精確到音位的語音分析結果
語音技術開發
ASR系統預訓練
作為語音識別系統的音位特徵提取器
提升下游ASR任務的性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase