W

WHISPER SMALL SWAHILI ASR CV 14

由dmusingu開發
該模型是基於OpenAI的Whisper large在Common Voice 14.0斯瓦希里語(SW)數據集上微調的語音識別模型,詞錯誤率(WER)為25.13%。
下載量 28
發布時間 : 4/19/2024

模型概述

一個針對斯瓦希里語優化的自動語音識別(ASR)模型,基於Whisper架構進行微調,適用於語音轉文本任務。

模型特點

低詞錯誤率
在Common Voice 14.0斯瓦希里語測試集上達到25.13%的詞錯誤率(WER)
基於Whisper架構
基於OpenAI強大的Whisper-large模型進行微調,繼承了其優秀的語音識別能力
專門針對斯瓦希里語優化
在Common Voice 14.0的斯瓦希里語數據集上進行訓練,對該語言有更好的識別效果

模型能力

語音轉文本
斯瓦希里語語音識別
長音頻處理

使用案例

語音轉錄
斯瓦希里語語音轉錄
將斯瓦希里語語音內容轉換為文本
詞錯誤率25.13%,字錯誤率9.83%
語音助手
斯瓦希里語語音助手
為斯瓦希里語用戶提供語音交互能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase