wav2vec2-xls-r-100m-common_voice-tr-ft開源模型 - 實現土耳其語自動語音識別

首頁

Wav2vec2 Xls R 100m Common Voice Tr Ft

由patrickvonplaten開發

該模型是基於facebook/wav2vec2-xls-r-100m在COMMON_VOICE - TR土耳其語數據集上微調的自動語音識別(ASR)模型。

語音識別

Transformers

其他開源協議:Apache-2.0 #土耳其語音識別 #低詞錯誤率 #多GPU訓練

下載量 16

發布時間 : 3/2/2022

模型概述

這是一個針對土耳其語的自動語音識別模型，基於wav2vec2-xls-r-100m架構微調，在Common Voice土耳其語數據集上訓練。

模型特點

高精度土耳其語識別

在Common Voice土耳其語評估集上取得了1.0的詞錯誤率(WER)和字符錯誤率(CER)

基於XLS-R架構

採用facebook的wav2vec2-xls-r-100m預訓練模型作為基礎，具有強大的語音特徵提取能力

多GPU訓練優化

使用8個GPU進行分佈式訓練，總批次大小為64，提高了訓練效率

模型能力

土耳其語語音識別

語音轉文本

音頻內容轉錄

使用案例

語音轉錄

土耳其語語音轉文字

將土耳其語語音內容轉換為文本

高準確率的轉錄結果

語音助手

土耳其語語音指令識別

用於土耳其語語音助手或智能家居設備的語音指令識別

訓練損失	輪數	步數	驗證損失	字錯率（Wer）	字符錯誤率（Cer）
3.1315	9.09	500	3.3832	1.0	1.0
3.1163	18.18	1000	3.4252	1.0	1.0
3.121	27.27	1500	3.4051	1.0	1.0
3.1273	36.36	2000	3.4345	1.0	1.0
3.2257	45.45	2500	3.4097	1.0	1.0

屬性	詳情
模型類型	基於微調的自動語音識別模型
訓練數據	COMMON_VOICE - TR 數據集

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Xls R 100m Common Voice Tr Ft

模型概述

模型特點

模型能力

使用案例

🚀 wav2vec2-xls-r-100m-common_voice-tr-ft

🚀 快速開始

✨ 主要特性

📦 安裝指南

💻 使用示例

📚 詳細文檔

模型描述

預期用途與限制

訓練和評估數據

🔧 技術細節

訓練超參數

訓練結果

框架版本

📄 許可證

信息表格