W

Wav2vec2 Xls R Parlaspeech Hr Lm

由classla開發
基於facebook/wav2vec2-xls-r-300m模型微調的克羅地亞語自動語音識別模型,使用ParlaSpeech-HR v1.0數據集訓練
下載量 18
發布時間 : 4/28/2022

模型概述

該模型是針對克羅地亞語的自動語音識別系統,基於wav2vec2-xls-r架構,專門用於將克羅地亞語語音轉換為文本

模型特點

高精度識別
在ParlaSpeech-HR測試集上達到3.63%的字符錯誤率和9.85%的詞錯誤率
議會語音優化
專門針對克羅地亞議會場景的語音數據進行訓練和優化
語言模型增強
結合語言模型(LM)進行解碼,提高識別準確率

模型能力

克羅地亞語語音識別
議會場景語音轉錄
即時語音轉文本

使用案例

政府機構
議會會議記錄
自動轉錄克羅地亞議會會議內容
提高會議記錄效率,減少人工轉錄成本
語音轉寫服務
克羅地亞語語音轉寫
為克羅地亞語用戶提供語音轉文字服務
準確率超過90%的詞識別率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase