wav2vec2-large-xls-r-300m-turkish-colab開源語音識別模型

Wav2vec2 Large Xls R 300m Turkish Colab

由krirk開發

基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型

下載量 17

發布時間 : 3/2/2022

模型概述

這是一個針對土耳其語優化的語音識別模型，基於wav2vec2-xls-r-300m架構微調，在common_voice數據集上訓練，能夠將土耳其語語音轉換為文本。

高性能土耳其語識別

在common_voice土耳其語測試集上達到31.49%的詞錯誤率

基於大規模預訓練模型

基於facebook的wav2vec2-xls-r-300m模型微調，繼承了其強大的語音特徵提取能力

端到端訓練

直接從原始音頻學習到文本輸出的映射，無需複雜的特徵工程

土耳其語語音識別

語音轉文本

連續語音識別

語音轉錄

土耳其語語音轉寫

將土耳其語語音內容轉換為文字記錄

在測試集上達到31.49%的詞錯誤率

語音助手

土耳其語語音指令識別

用於土耳其語語音助手的語音指令理解

訓練損失	輪數	步數	驗證損失	字錯率（Wer）
3.9921	3.67	400	0.7820	0.7857
0.4496	7.34	800	0.4630	0.4977
0.2057	11.01	1200	0.4293	0.4627
0.1328	14.68	1600	0.4464	0.4068
0.1009	18.35	2000	0.4461	0.3742
0.0794	22.02	2400	0.4328	0.3467
0.0628	25.69	2800	0.4036	0.3263
0.0497	29.36	3200	0.3942	0.3149