Wav2vec2-large-robust-Pronunciation-Evaluation Open-source Model - Free for Speech Quality and Pronunciation Evaluation

Wav2vec2 Large Robust Pronounciation Evaluation

Developed by hafidikhsan

A pronunciation assessment model fine-tuned based on facebook/wav2vec2-large-robust for speech quality evaluation tasks

Open Source License:Apache-2.0 #Speech Pronunciation Assessment #High-Precision Speech Analysis #Educational Technology Application

Downloads 242

Release Time : 6/26/2023

Model Overview

This model is a pronunciation assessment model fine-tuned on the wav2vec2-large-robust architecture, primarily used to evaluate speech pronunciation quality, capable of calculating metrics such as accuracy and F1 score

Model Features

High-Precision Pronunciation Assessment

Achieves 72% accuracy and F1 score on the test set

Based on wav2vec2-large-robust Architecture

Utilizes powerful pre-trained speech representation capabilities for fine-tuning

Multi-Metric Evaluation

Supports various evaluation metrics such as accuracy, F1 score, precision, and recall

Model Capabilities

Speech Quality Evaluation

Pronunciation Accuracy Analysis

Speech Feature Extraction

Use Cases

Language Learning

Foreign Language Pronunciation Assessment

Used to evaluate the pronunciation accuracy of foreign language learners

Can provide an evaluation accuracy of 72%

Speech Quality Detection

Speech Synthesis Quality Evaluation

Evaluates the quality of speech generated by TTS systems

Training Loss	Epoch	Step	Validation Loss	Accuracy	F1	Precision	Recall
0.7468	1.0	500	0.9762	0.616	0.616	0.616	0.616
0.492	2.0	1000	1.1308	0.536	0.536	0.536	0.536
0.619	3.0	1500	0.7913	0.688	0.688	0.688	0.688
0.56	4.0	2000	0.8142	0.67	0.67	0.67	0.67
0.4561	5.0	2500	0.7452	0.708	0.708	0.708	0.708
0.5474	6.0	3000	0.7846	0.72	0.72	0.72	0.72

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Wav2vec2 Large Robust Pronounciation Evaluation

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Wav2vec2-large-robust-Pronounciation-Evaluation

🚀 Quick Start

📚 Documentation

Training and evaluation data

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License