G

Galician Xlsr

由Akashpb13開發
該模型是基於facebook/wav2vec2-xls-r-300m在加利西亞語數據集上微調的自動語音識別模型,在Common Voice 8.0測試集上取得了11.31%的WER。
下載量 110
發布時間 : 3/2/2022

模型概述

這是一個用於加利西亞語的自動語音識別模型,基於XLS-R架構微調而成,適用於語音轉文本任務。

模型特點

多數據集訓練
模型使用了Common Voice加利西亞語數據集中的train.tsv、dev.tsv、invalidated.tsv、reported.tsv和other.tsv進行訓練
高質量數據篩選
僅使用支持票數高於反對票數的數據點,並在合併數據集後去除重複項
優化的訓練過程
採用cosine_with_restarts學習率調度器,並進行了100輪訓練

模型能力

加利西亞語語音識別
語音轉文本
支持多種語音輸入格式

使用案例

語音轉錄
加利西亞語語音轉錄
將加利西亞語語音轉換為文本
在Common Voice 8.0測試集上WER為11.31%
語音助手
加利西亞語語音助手
用於加利西亞語語音交互系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase