W

Wav2vec2 Large 100k Voxpopuli Catala

由ccoreilly開發
基於facebook/wav2vec2-large-100k-voxpopuli模型微調的加泰羅尼亞語語音識別模型
下載量 56
發布時間 : 3/2/2022

模型概述

這是一個針對加泰羅尼亞語的自動語音識別(ASR)模型,使用Common Voice和ParlamentParla數據集進行微調,能夠將加泰羅尼亞語語音轉換為文本。

模型特點

多數據集訓練
結合使用Common Voice和ParlamentParla兩個數據集進行訓練,提高模型泛化能力
低詞錯誤率
在測試集上達到5.98%的詞錯誤率(WER),表現優異
16kHz採樣率支持
專門優化支持16kHz採樣率的語音輸入

模型能力

加泰羅尼亞語語音識別
語音轉文本
自動語音識別

使用案例

語音轉錄
議會發言轉錄
將加泰羅尼亞議會發言錄音轉換為文字記錄
在ParlamentParla數據集上表現良好
語音助手
為加泰羅尼亞語語音助手提供語音識別能力
教育
語言學習應用
用於加泰羅尼亞語學習應用的發音評估功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase