W

Wav2vec2 Xls R 300m Hebrew

由imvladikon開發
這是一個基於facebook/wav2vec2-xls-r-300m模型微調的希伯來語自動語音識別模型,通過兩階段訓練在小規模和大規模數據集上優化性能。
下載量 1.2M
發布時間 : 3/2/2022

模型概述

該模型專門用於希伯來語的自動語音識別任務,通過兩階段微調過程在小規模高質量數據集和大規模多樣化數據集上進行訓練,以提高識別準確率。

模型特點

兩階段微調訓練
先在小規模高質量數據集上微調,再在大規模多樣化數據集上進行二次訓練,提高模型魯棒性
多源數據訓練
訓練數據包含高質量標註數據、多樣化來源數據以及模型弱標記的未標記數據
低詞錯誤率
在小規模測試集上達到17.73%的詞錯誤率,在大規模測試集上達到23.18%的詞錯誤率

模型能力

希伯來語語音識別
音頻轉文本
魯棒語音處理

使用案例

語音轉錄
希伯來語會議記錄
將希伯來語會議錄音自動轉錄為文本
詞錯誤率約23.18%
希伯來語語音助手
為希伯來語語音助手提供語音識別能力
語音分析
希伯來語語音內容分析
分析希伯來語語音內容並提取關鍵信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase