wav2vec2-large-xls-r-300m-slovenian開源語音識別模型

首頁

Wav2vec2 Large Xls R 300m Slovenian

由bekirbakar開發

該模型是基於facebook/wav2vec2-xls-r-300m在common_voice斯洛文尼亞語數據集上微調的語音識別模型，詞錯誤率為0.3271。

語音識別

Transformers

開源協議:Apache-2.0 #斯洛文尼亞語語音識別 #高精度語音轉文本 #多語言預訓練微調

下載量 278

發布時間 : 6/6/2022

模型概述

一個針對斯洛文尼亞語優化的語音識別模型，基於wav2vec2-xls-r-300m架構微調，適用於語音轉文本任務。

模型特點

高性能語音識別

在common_voice斯洛文尼亞語數據集上取得了0.3271的詞錯誤率

基於大模型微調

基於3億參數的wav2vec2-xls-r-300m模型進行微調，繼承了原模型的強大特徵提取能力

優化訓練流程

採用線性學習率調度和500步預熱，訓練20輪達到最佳效果

模型能力

斯洛文尼亞語語音識別

音頻轉文本

語音內容分析

使用案例

語音轉錄

會議記錄自動化

將斯洛文尼亞語會議錄音自動轉為文字記錄

準確率約67.29%

語音助手

為斯洛文尼亞語用戶提供語音交互支持

教育技術

語言學習應用

幫助學習者練習斯洛文尼亞語發音和聽力

訓練損失	輪數	步數	驗證損失	詞錯誤率（Wer）
4.3681	4.93	400	0.7067	0.6486
0.2311	9.87	800	0.5155	0.4341
0.0833	14.81	1200	0.4996	0.3799
0.0455	19.75	1600	0.4462	0.3271

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Wav2vec2 Large Xls R 300m Slovenian

模型概述

模型特點

模型能力

使用案例

🚀 wav2vec2-large-xls-r-300m-slovenian

📚 詳細文檔

訓練流程

訓練超參數

訓練結果

框架版本

📄 許可證