wav2vec2-large-xls-r-300m-urdu開源模型 - 免費部署精準烏爾都語語音識別

首頁

Wav2vec2 Large Xls R 300m Urdu

由omar47開發

該模型是基於facebook/wav2vec2-xls-r-300m微調的版本，專門針對烏爾都語語音識別任務進行了優化。

語音識別

Transformers

開源協議:Apache-2.0 #烏爾都語語音識別 #低詞錯誤率 #大模型微調

下載量 27

發布時間 : 4/29/2022

模型概述

這是一個用於烏爾都語語音識別的自動語音識別(ASR)模型，基於wav2vec2-xls-r-300m架構微調，在評估集上取得了17.02%的詞錯誤率(WER)。

模型特點

烏爾都語優化

專門針對烏爾都語語音特徵進行微調，提高了識別準確率

低詞錯誤率

在評估集上取得了17.02%的詞錯誤率(WER)

基於大模型微調

基於facebook/wav2vec2-xls-r-300m大模型進行微調，繼承了其強大的語音特徵提取能力

模型能力

烏爾都語語音識別

音頻轉文本

語音轉錄

使用案例

語音轉錄

烏爾都語會議記錄

將烏爾都語會議錄音自動轉錄為文字記錄

約83%的準確率

語音助手

用於烏爾都語語音助手應用的語音識別組件

教育

語言學習應用

幫助學習者練習烏爾都語發音並提供反饋

🚀 wav2vec2-large-xls-r-300m-urdu

本模型是基於facebook/wav2vec2-xls-r-300m微調得到的版本。它在評估集上取得了以下結果：

損失值：0.5285
字錯率（Wer）：0.1702

🚀 快速開始

本模型可直接用於烏爾都語語音相關的任務，如語音識別等。你可以按照以下步驟使用：

安裝必要的庫，如transformers等。
加載模型並進行推理。

📚 詳細文檔

模型描述

本模型是對facebook/wav2vec2-xls-r-300m進行微調後的版本，用於烏爾都語相關語音任務。

預期用途與限制

文檔中未詳細提及預期用途與限制，後續可根據實際情況補充。

訓練和評估數據

文檔中未詳細提及訓練和評估數據的相關信息，後續可根據實際情況補充。

訓練過程

訓練超參數

訓練過程中使用了以下超參數：

屬性	詳情
學習率	0.0003
訓練批次大小	16
評估批次大小	8
隨機種子	42
梯度累積步數	2
總訓練批次大小	32
優化器	Adam（β1=0.9，β2=0.999，ε=1e-08）
學習率調度器類型	線性
學習率調度器熱身步數	500
訓練輪數	35
混合精度訓練	Native AMP

訓練結果

訓練損失	輪數	步數	驗證損失	字錯率（Wer）
16.9618	0.74	32	15.0745	1.0
9.1928	1.49	64	5.9361	1.0
4.9307	2.23	96	4.2924	1.0
3.8917	2.98	128	3.5873	1.0
3.3867	3.72	160	3.2594	1.0
3.2107	4.47	192	3.1718	1.0
3.1395	5.21	224	3.1281	1.0
3.115	5.95	256	3.1238	1.0
3.0801	6.7	288	3.0674	1.0
2.9725	7.44	320	2.8277	1.0
2.4159	8.19	352	1.7186	0.9036
1.3377	8.93	384	1.0271	0.6433
0.8591	9.67	416	0.8087	0.5441
0.726	10.42	448	0.7263	0.4634
0.6242	11.16	480	0.6783	0.4156
0.5417	11.91	512	0.6611	0.4305
0.4784	12.65	544	0.6300	0.3926
0.4198	13.4	576	0.5646	0.3499
0.3798	14.14	608	0.5919	0.3229
0.3356	14.88	640	0.5715	0.3369
0.2954	15.63	672	0.5325	0.2728
0.264	16.37	704	0.5535	0.2689
0.2535	17.12	736	0.5467	0.2366
0.2277	17.86	768	0.5219	0.2345
0.2141	18.6	800	0.5314	0.2487
0.2036	19.35	832	0.5382	0.2236
0.2021	20.09	864	0.5038	0.1922
0.1676	20.84	896	0.5238	0.2033
0.1544	21.58	928	0.5069	0.1866
0.1512	22.33	960	0.5045	0.1965
0.1512	23.07	992	0.5167	0.1862
0.1399	23.81	1024	0.5236	0.1840
0.1291	24.56	1056	0.5234	0.1957
0.1274	25.3	1088	0.5348	0.1943
0.127	26.05	1120	0.4978	0.1719
0.1105	26.79	1152	0.5067	0.1767
0.1069	27.53	1184	0.5150	0.1758
0.1058	28.28	1216	0.5218	0.1844
0.0999	29.02	1248	0.5375	0.1852
0.0964	29.77	1280	0.5373	0.1843
0.0971	30.51	1312	0.5190	0.1776
0.0906	31.26	1344	0.5217	0.1747
0.0909	32.0	1376	0.5204	0.1778
0.0784	32.74	1408	0.5336	0.1756
0.0823	33.49	1440	0.5281	0.1699
0.0834	34.23	1472	0.5292	0.1700
0.0827	34.98	1504	0.5285	0.1702