Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型,在評估集上取得了0.3174的詞錯誤率。
語音識別
Transformers

W
vishwasgautam
14
0
Distil Large V3.5 ONNX
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知識蒸餾版本,提供更優的性能表現和高效性。
語音識別
Transformers 英語

D
distil-whisper
25
1
Ichigo Llama3.1 S Instruct V0.3 Phase 3
Apache-2.0
Ichigo-llama3s是一個支持音頻和文本輸入的大語言模型系列,專注於提升聲音理解能力和用戶交互體驗。
文本生成音頻 英語
I
homebrewltd
43
35
Whisper Ner V1
MIT
WhisperNER是一種能夠同時進行語音轉錄和實體識別的新穎模型,支持開放類型的命名實體識別(NER)。
語音識別 支持多種語言
W
aiola
174
23
Phoneme Scorer V2 Wav2vec2
Apache-2.0
基於Wav2Vec2-Base架構的自動語音識別模型,專門用於音素識別,在LJSpeech Phonemes數據集上微調
語音識別
Transformers 英語

P
ct-vikramanantha
167
9
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002
Apache-2.0
基於facebook/wav2vec2-large-lv60在TIMIT數據集上微調的英語音素識別模型,音素錯誤率10.53%
語音識別
Transformers 英語

W
excalibur12
103
1
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k
Apache-2.0
基於facebook/wav2vec2-large-lv60微調的英語音素識別模型,在TIMIT數據集上取得10.53%的音素錯誤率
語音識別
Transformers 英語

W
excalibur12
306
3
Gazelle V0.2
Apache-2.0
Gazelle v0.2 是由 Tincans 發佈的聯合語音-語言模型,支持英語。
文本生成音頻
Transformers 英語

G
tincans-ai
90
99
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型
音頻分類
Transformers

W
firdho26
68
0
Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8
Apache-2.0
基於wav2vec2架構的英語語音情感識別模型,在RAVDESS數據集上微調
音頻分類
Transformers

W
Wiam
94
4
Wav2vec2 Base Speech Emotion Recognition
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感識別模型,用於預測音頻樣本中說話者的情感。
音頻分類
Transformers 英語

W
DunnBC22
128
13
Wav2vec2 Ljspeech Gruut
Apache-2.0
基於Wav2Vec2架構的音素識別模型,在LJSpeech Phonemes數據集上微調,用於將語音轉換為音素序列
語音識別
Transformers 英語

W
bookbot
2,484
17
Wav2vec2 Large 960h Intent Classification Ori
Apache-2.0
基於facebook/wav2vec2-large-960h微調的意圖分類模型,在評估集上準確率達77.08%
音頻分類
Transformers

W
MuhammadIqbalBazmi
15
0
Wav2vec2 Large Tedlium
Apache-2.0
基於TEDLIUM語料庫微調的Wav2Vec2大型語音識別模型,支持英語語音轉文本
語音識別 英語
W
sanchit-gandhi
58
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在Google Colab環境下訓練完成。
語音識別
Transformers

W
pannaga
16
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型,具有較低的詞錯誤率(WER)。
語音識別
Transformers

W
nawta
96
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文字任務
語音識別
Transformers

W
dasolj
127
0
Wav2vec Cv
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型
語音識別
Transformers

W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型,在評估集上詞錯誤率為1.0
語音識別
Transformers

W
eugenetanjc
68
0
Wav2vec2 Base Dataset Asr Demo Colab
Apache-2.0
這是一個基於distilhubert在superb數據集上微調的語音識別模型,主要用於自動語音識別(ASR)任務。
語音識別
Transformers

W
aminnaghavi
34
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在評估集上取得了0.3384的詞錯誤率(WER)。
語音識別
Transformers

W
mikeluck
38
0
Assignment1 Francesco
MIT
基於語音到文本轉換器(S2T)訓練的自動語音識別(ASR)模型,專為英語語音識別設計
語音識別
Transformers 英語

A
Classroom-workshop
22
0
Wav2vec2 19
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,支持自動語音轉文字任務
語音識別
Transformers

W
chrisvinsen
18
0
Xlsr English
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在librispeech_asr數據集上微調的英語語音識別模型
語音識別
Transformers

X
ashesicsis1
18
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文字任務。
語音識別
Transformers

W
wrice
17
0
Wav2vec2 Base Timit Google Colab
Apache-2.0
基於facebook/wav2vec2-base在空數據集上微調的語音識別模型,在評估集上取得了0.3355的詞錯誤率(WER)。
語音識別
Transformers

W
anithapappu
19
0
Wav2vec2 7
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音識別模型,在評估集上取得了0.52的詞錯誤率。
語音識別
Transformers

W
chrisvinsen
20
0
D L Dl
該模型是基於facebook/wav2vec2-base-960h微調的語音識別模型,在評估集上詞錯誤率(WER)為1.0。
語音識別
Transformers

D
bkh6722
25
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,適用於英語語音轉文本任務
語音識別
Transformers

W
BitanBiswas
28
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,主要用於英語語音轉文字任務。
語音識別
Transformers

W
patrickvonplaten
26
2
Wav2vec2 Base Timit Demo Colab92
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別
Transformers

W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab90
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文本任務
語音識別
Transformers

W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab11
Apache-2.0
該模型是基於facebook/wav2vec2-base進行微調的語音識別模型,在TIMIT數據集上取得了0.4348的詞錯誤率。
語音識別
Transformers

W
sameearif88
18
0
Wav2vec2 Base Timit Demo Colab 1
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上訓練,詞錯誤率(WER)為0.4398。
語音識別
Transformers

W
zasheza
18
0
Wav2vec2 Base Timit Demo Colab2
Apache-2.0
該模型是基於facebook/wav2vec2-base微調得到的語音識別模型,在評估集上取得了0.5664的詞錯誤率(WER)。
語音識別
Transformers

W
sameearif88
16
0
Wav2vec2 Base Timit Ali Hasan Colab EX2
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上訓練,評估集WER為0.4458
語音識別
Transformers

W
ali221000262
23
0
Wav2vec2 Base Timit Ali Hasan Colab
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上訓練
語音識別
Transformers

W
ali221000262
25
0
Wav2vec2 Base Timit Moaiz Exp2
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別
Transformers

W
moaiz237
24
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別
Transformers

W
ali221000262
23
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在TIMIT數據集上進行了訓練和評估。
語音識別
Transformers

W
shumail
24
0
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98