wav2vec2-large-xlsr-53-amharic開源語音識別模型

首頁

Wav2vec2 Large Xlsr 53 Amharic

由agkphysics開發

該模型是在facebook/wav2vec2-large-xlsr-53基礎上，使用阿姆哈拉語語音語料庫進行微調的自動語音識別(ASR)模型。

語音識別

Transformers

其他開源協議:MIT #阿姆哈拉語語音識別 #低詞錯誤率(26%)#非洲語言支持

下載量 2,539

發布時間 : 5/18/2023

模型概述

用於阿姆哈拉語的自動語音識別任務，在朗讀語音數據上表現良好。

模型特點

高精度阿姆哈拉語識別

在驗證集上達到26%的詞錯誤率和7%的字符錯誤率

基於XLSR-53微調

在強大的多語言預訓練模型基礎上進行領域適配

開源許可

採用MIT許可證，允許自由使用和修改

模型能力

阿姆哈拉語語音識別

音頻轉文本

朗讀語音處理

使用案例

語音轉錄

阿姆哈拉語語音轉文字

將阿姆哈拉語語音內容轉換為文字

在朗讀語音上達到26% WER

語言處理

阿姆哈拉語語音助手

構建支持阿姆哈拉語的語音交互系統

屬性	詳情
模型類型	基於微調 Wav2vec2 XLSR - 53 的阿姆哈拉語自動語音識別模型
訓練數據	阿姆哈拉語語音語料庫
指標	單詞錯誤率（WER）、字符錯誤率（CER）
任務類型	自動語音識別

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Large Xlsr 53 Amharic

模型概述

模型特點

模型能力

使用案例

🚀 基於微調Wav2vec2 XLSR - 53的阿姆哈拉語自動語音識別

🚀 快速開始

📚 詳細文檔

📄 許可證