S

Swahili Xlsr

由Akashpb13開發
基於facebook/wav2vec2-xls-r-300m微調的斯瓦希里語自動語音識別模型,在Common Voice 8數據集上訓練
下載量 26
發布時間 : 3/2/2022

模型概述

該模型是針對斯瓦希里語優化的自動語音識別(ASR)模型,基於XLS-R架構微調,適用於語音轉文本任務

模型特點

多語言支持
基於XLS-R架構,具備處理多種語言的能力
高性能指標
在Common Voice 8測試集上達到11.76% WER和2.88% CER
魯棒性訓練
訓練數據經過嚴格篩選,僅使用支持票數高於反對票數的樣本

模型能力

語音轉文本
斯瓦希里語識別
多語言語音處理

使用案例

語音轉錄
斯瓦希里語語音轉錄
將斯瓦希里語語音內容轉換為文本
測試WER 0.1176,CER 0.0288
語音助手
斯瓦希里語語音命令識別
用於東非地區語音助手應用的命令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase