xlsr-53-bemba-5hrs開源語音識別模型 - 免費部署支持Bemba語識別

首頁

Xlsr 53 Bemba 5hrs

由csikasote開發

基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型，支持Bemba語

語音識別

Transformers

開源協議:Apache-2.0 #低資源語音識別 #多語言微調 #非洲語言處理

下載量 25

發布時間 : 4/29/2022

模型概述

該模型是針對Bemba語優化的自動語音識別(ASR)模型，在5小時Bemba語音數據上微調，適用於低資源語言的語音轉文本任務

模型特點

低資源語言優化

專門針對Bemba這類低資源語言進行優化，僅需5小時訓練數據

基於XLSR架構

利用跨語言語音表示學習(XLSR)的強大能力，實現更好的語音特徵提取

輕量級微調

在大型預訓練模型基礎上進行高效微調，平衡性能與計算成本

模型能力

Bemba語音識別

語音轉文本

低資源語言處理

使用案例

語音轉錄

Bemba語音記錄轉寫

將Bemba語的會議記錄、訪談等內容轉為文字

詞錯誤率(WER)約48.67%

語言保護

瀕危語言數字化

幫助記錄和保護Bemba等低資源語言的語音資料

訓練損失	輪數	步數	驗證損失	字錯率（Wer）
3.2701	2.16	400	0.4047	0.6230
0.488	4.32	800	0.3002	0.4917
0.2807	6.49	1200	0.3342	0.4802
0.1696	8.65	1600	0.3414	0.4867

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Xlsr 53 Bemba 5hrs

模型概述

模型特點

模型能力

使用案例

🚀 xlsr-53-bemba-5hrs

🚀 快速開始

📄 許可證

📚 詳細文檔

模型描述

預期用途和限制

訓練和評估數據

訓練過程

訓練超參數

訓練結果

框架版本