W

Wav2vec2 Base Timit Demo Colab3000

Developed by hassnain
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型,適用於英語語音轉文本任務。
Downloads 23
Release Time : 5/2/2022

Model Overview

該模型是wav2vec2-base的微調版本,專門用於英語語音識別任務,在TIMIT數據集上進行了訓練和評估。

Model Features

基於wav2vec2架構
採用Facebook提出的wav2vec2基礎架構,具有強大的語音特徵提取能力。
TIMIT數據集微調
在標準TIMIT語音數據集上進行微調,優化了英語語音識別性能。
高效推理
評估階段每秒可處理約9.8個樣本,具備較高的處理效率。

Model Capabilities

英語語音識別
音頻轉文本
連續語音識別

Use Cases

語音轉錄
英語語音轉錄
將英語語音內容轉換為文本形式
詞錯誤率(WER)為0.3845
教育應用
發音評估
可用於語言學習中的發音準確性評估
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase