W

Wav2vec2 Large Xls R 300m German With Lm

由mfleck開發
基於facebook/wav2vec2-xls-r-300m在Common Voice德語數據集上微調的語音識別模型,集成n-gram語言模型,詞錯誤率8.8%
下載量 26
發布時間 : 3/10/2022

模型概述

該模型是針對德語優化的自動語音識別(ASR)系統,適用於將德語語音轉換為文本。

模型特點

語言模型增強
集成n-gram語言模型提升識別準確率
高性能
在Common Voice評估集上達到8.8%的詞錯誤率
大規模預訓練
基於3億參數的XLS-R架構微調

模型能力

德語語音識別
長音頻處理(支持分塊處理)

使用案例

語音轉文字
會議記錄
將德語會議錄音轉換為文字記錄
高準確率的轉錄文本
媒體字幕生成
為德語視頻內容自動生成字幕
支持5秒音頻塊處理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase