W

Wav2vec2 Large Xlsr 53 Amharic

由agkphysics開發
該模型是在facebook/wav2vec2-large-xlsr-53基礎上,使用阿姆哈拉語語音語料庫進行微調的自動語音識別(ASR)模型。
下載量 2,539
發布時間 : 5/18/2023

模型概述

用於阿姆哈拉語的自動語音識別任務,在朗讀語音數據上表現良好。

模型特點

高精度阿姆哈拉語識別
在驗證集上達到26%的詞錯誤率和7%的字符錯誤率
基於XLSR-53微調
在強大的多語言預訓練模型基礎上進行領域適配
開源許可
採用MIT許可證,允許自由使用和修改

模型能力

阿姆哈拉語語音識別
音頻轉文本
朗讀語音處理

使用案例

語音轉錄
阿姆哈拉語語音轉文字
將阿姆哈拉語語音內容轉換為文字
在朗讀語音上達到26% WER
語言處理
阿姆哈拉語語音助手
構建支持阿姆哈拉語的語音交互系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase