# 英語語音處理

Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型,在評估集上取得了0.3174的詞錯誤率。
語音識別 Transformers
W
vishwasgautam
14
0
Distil Large V3.5 ONNX
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知識蒸餾版本,提供更優的性能表現和高效性。
語音識別 Transformers 英語
D
distil-whisper
25
1
Ichigo Llama3.1 S Instruct V0.3 Phase 3
Apache-2.0
Ichigo-llama3s是一個支持音頻和文本輸入的大語言模型系列,專注於提升聲音理解能力和用戶交互體驗。
文本生成音頻 英語
I
homebrewltd
43
35
Whisper Ner V1
MIT
WhisperNER是一種能夠同時進行語音轉錄和實體識別的新穎模型,支持開放類型的命名實體識別(NER)。
語音識別 支持多種語言
W
aiola
174
23
Phoneme Scorer V2 Wav2vec2
Apache-2.0
基於Wav2Vec2-Base架構的自動語音識別模型,專門用於音素識別,在LJSpeech Phonemes數據集上微調
語音識別 Transformers 英語
P
ct-vikramanantha
167
9
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002
Apache-2.0
基於facebook/wav2vec2-large-lv60在TIMIT數據集上微調的英語音素識別模型,音素錯誤率10.53%
語音識別 Transformers 英語
W
excalibur12
103
1
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k
Apache-2.0
基於facebook/wav2vec2-large-lv60微調的英語音素識別模型,在TIMIT數據集上取得10.53%的音素錯誤率
語音識別 Transformers 英語
W
excalibur12
306
3
Gazelle V0.2
Apache-2.0
Gazelle v0.2 是由 Tincans 發佈的聯合語音-語言模型,支持英語。
文本生成音頻 Transformers 英語
G
tincans-ai
90
99
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型
音頻分類 Transformers
W
firdho26
68
0
Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8
Apache-2.0
基於wav2vec2架構的英語語音情感識別模型,在RAVDESS數據集上微調
音頻分類 Transformers
W
Wiam
94
4
Wav2vec2 Base Speech Emotion Recognition
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感識別模型,用於預測音頻樣本中說話者的情感。
音頻分類 Transformers 英語
W
DunnBC22
128
13
Wav2vec2 Ljspeech Gruut
Apache-2.0
基於Wav2Vec2架構的音素識別模型,在LJSpeech Phonemes數據集上微調,用於將語音轉換為音素序列
語音識別 Transformers 英語
W
bookbot
2,484
17
Wav2vec2 Large 960h Intent Classification Ori
Apache-2.0
基於facebook/wav2vec2-large-960h微調的意圖分類模型,在評估集上準確率達77.08%
音頻分類 Transformers
W
MuhammadIqbalBazmi
15
0
Wav2vec2 Large Tedlium
Apache-2.0
基於TEDLIUM語料庫微調的Wav2Vec2大型語音識別模型,支持英語語音轉文本
語音識別 英語
W
sanchit-gandhi
58
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在Google Colab環境下訓練完成。
語音識別 Transformers
W
pannaga
16
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型,具有較低的詞錯誤率(WER)。
語音識別 Transformers
W
nawta
96
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文字任務
語音識別 Transformers
W
dasolj
127
0
Wav2vec Cv
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型
語音識別 Transformers
W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型,在評估集上詞錯誤率為1.0
語音識別 Transformers
W
eugenetanjc
68
0
Wav2vec2 Base Dataset Asr Demo Colab
Apache-2.0
這是一個基於distilhubert在superb數據集上微調的語音識別模型,主要用於自動語音識別(ASR)任務。
語音識別 Transformers
W
aminnaghavi
34
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在評估集上取得了0.3384的詞錯誤率(WER)。
語音識別 Transformers
W
mikeluck
38
0
Assignment1 Francesco
MIT
基於語音到文本轉換器(S2T)訓練的自動語音識別(ASR)模型,專為英語語音識別設計
語音識別 Transformers 英語
A
Classroom-workshop
22
0
Wav2vec2 19
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,支持自動語音轉文字任務
語音識別 Transformers
W
chrisvinsen
18
0
Xlsr English
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在librispeech_asr數據集上微調的英語語音識別模型
語音識別 Transformers
X
ashesicsis1
18
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文字任務。
語音識別 Transformers
W
wrice
17
0
Wav2vec2 Base Timit Google Colab
Apache-2.0
基於facebook/wav2vec2-base在空數據集上微調的語音識別模型,在評估集上取得了0.3355的詞錯誤率(WER)。
語音識別 Transformers
W
anithapappu
19
0
Wav2vec2 7
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音識別模型,在評估集上取得了0.52的詞錯誤率。
語音識別 Transformers
W
chrisvinsen
20
0
D L Dl
該模型是基於facebook/wav2vec2-base-960h微調的語音識別模型,在評估集上詞錯誤率(WER)為1.0。
語音識別 Transformers
D
bkh6722
25
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,適用於英語語音轉文本任務
語音識別 Transformers
W
BitanBiswas
28
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,主要用於英語語音轉文字任務。
語音識別 Transformers
W
patrickvonplaten
26
2
Wav2vec2 Base Timit Demo Colab92
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別 Transformers
W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab90
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文本任務
語音識別 Transformers
W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab11
Apache-2.0
該模型是基於facebook/wav2vec2-base進行微調的語音識別模型,在TIMIT數據集上取得了0.4348的詞錯誤率。
語音識別 Transformers
W
sameearif88
18
0
Wav2vec2 Base Timit Demo Colab 1
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上訓練,詞錯誤率(WER)為0.4398。
語音識別 Transformers
W
zasheza
18
0
Wav2vec2 Base Timit Demo Colab2
Apache-2.0
該模型是基於facebook/wav2vec2-base微調得到的語音識別模型,在評估集上取得了0.5664的詞錯誤率(WER)。
語音識別 Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Ali Hasan Colab EX2
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上訓練,評估集WER為0.4458
語音識別 Transformers
W
ali221000262
23
0
Wav2vec2 Base Timit Ali Hasan Colab
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上訓練
語音識別 Transformers
W
ali221000262
25
0
Wav2vec2 Base Timit Moaiz Exp2
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別 Transformers
W
moaiz237
24
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別 Transformers
W
ali221000262
23
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在TIMIT數據集上進行了訓練和評估。
語音識別 Transformers
W
shumail
24
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase