wav2vec2-large-xls-r-300m-romansh-sursilvan開源模型 - 精準識別羅曼什語蘇塞爾瓦方言語音

首頁

Wav2vec2 Large Xls R 300m Romansh Sursilvan

由infinitejoy開發

基於facebook/wav2vec2-xls-r-300m在羅曼什語蘇塞爾瓦方言數據集上微調的自動語音識別模型

語音識別

Transformers

開源協議:Apache-2.0 #羅曼什語語音識別 #低詞錯誤率 #多語言支持

下載量 15

發布時間 : 3/2/2022

模型概述

這是一個針對羅曼什語蘇塞爾瓦方言的自動語音識別(ASR)模型，基於XLS-R-300M架構微調，在Common Voice 7數據集上取得了19.81%的詞錯誤率(WER)。

模型特點

低詞錯誤率

在羅曼什語蘇塞爾瓦方言測試集上取得19.81%的WER和4.15%的CER

基於XLS-R架構

使用強大的XLS-R-300M作為基礎模型，具有良好的語音表示能力

針對低資源語言優化

專門為羅曼什語蘇塞爾瓦方言這種相對低資源的語言進行優化

模型能力

語音轉文本

羅曼什語蘇塞爾瓦方言識別

連續語音識別

使用案例

語音轉錄

羅曼什語語音轉錄

將羅曼什語蘇塞爾瓦方言的語音內容轉換為文本

詞錯誤率19.81%，字符錯誤率4.15%

語音助手

羅曼什語語音指令識別

用於支持羅曼什語的語音助手和智能設備

屬性	詳情
模型類型	XLS - R - 300M - Romansh Sursilvan
訓練數據	mozilla - foundation/common_voice_7_0（rm - sursilv）

訓練損失	輪數	步數	驗證損失	詞錯誤率（Wer）
1.1004	23.81	2000	0.3710	0.4191
0.7002	47.62	4000	0.2342	0.2562
0.5573	71.43	6000	0.2175	0.2177
0.4799	95.24	8000	0.2109	0.1987
0.4511	119.05	10000	0.2164	0.1975

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Large Xls R 300m Romansh Sursilvan

模型概述

模型特點

模型能力

使用案例

🚀 wav2vec2-large-xls-r-300m-romansh-sursilvan

✨ 主要特性

📚 詳細文檔

模型信息

評估結果

訓練過程

訓練超參數

訓練結果

框架版本

📄 許可證