Ultravox V0 5 Llama 3 2 1b GGUF
MIT
Ultravox v0.5是基於Llama-3 2.1B架構優化的音頻文本轉文本模型,專注於高效處理語音轉寫任務。
語音識別
U
ggml-org
421
1
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型,在評估集上取得了0.3174的詞錯誤率。
語音識別
Transformers

W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
基於facebook/hubert-large-ls960-ft微調的語音識別模型,在LibriSpeech數據集上訓練
語音識別
Transformers

H
vishwasgautam
101
0
Wav2vec Checkpoints
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上準確率達99.48%
語音識別
Transformers

W
Zeyadd-Mostaffa
19
0
Deepfake Audio Detection
Apache-2.0
基於wav2vec2-base-finetuned進一步微調的語音處理模型,在評估集上準確率達98.82%
語音識別
Transformers

D
motheecreator
1,468
7
Deepfake Audio Detection
Apache-2.0
基於wav2vec2-base-finetuned模型微調的語音處理模型,在評估集上準確率達98.82%
語音識別
Transformers

D
mo-thecreator
801
7
Wav2vec2 Phoneme
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型,專注於音素識別任務
語音識別
Transformers

W
Bluecast
189
3
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上達到99.97%的準確率
語音識別
Transformers

W
mo-thecreator
19
4
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上準確率達99.97%
語音識別
Transformers

W
motheecreator
105
4
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於wav2vec2-base模型在音頻文件夾數據集上微調的音頻分類模型,驗證集準確率達99.82%
音頻分類
Transformers

W
motheecreator
54
3
Whisper Small Dialect Classifier Cross
Apache-2.0
該模型是基於whisper-small架構的方言分類器,用於識別和分類特定方言的語音輸入。
音頻分類
Transformers

W
yaygomii
53
1
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上表現出色
語音識別
Transformers

B
Juardo
19
0
Neunit Ks Kangyuan0601
Apache-2.0
該模型是基於facebook/wav2vec2-base在superb數據集上微調的音頻分類模型,在評估集上取得了99.87%的準確率。
音頻分類
Transformers

N
SHENMU007
16
0
Wav2vec2 Base Finetuned Amd
Apache-2.0
該模型是基於facebook/wav2vec2-base在未知數據集上微調的版本,主要用於語音識別任務,在評估集上達到84.55%的準確率。
語音識別
Transformers

W
justin1983
14
0
Audio Class Finetuned
Apache-2.0
該模型是基於facebook/wav2vec2-base在superb數據集上微調的音頻分類模型,在評估集上取得了0.6578的準確率。
音頻分類
Transformers

A
Chemsseddine
20
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於facebook/wav2vec2-base在superb數據集上微調的語音識別模型,準確率達98.34%
語音識別
Transformers

W
marcatanante1
13
0
Whisper Small ISSAI KSC 335RS V2
基於Whisper架構的小型語音識別模型,適用於特定領域的語音轉文本任務
語音識別
Transformers

W
Shirali
83
1
Englishmodel
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m微調的語音識別模型,主要用於英語語音轉文本任務。
語音識別
Transformers

E
Foxasdf
24
1
Wav2vec2 Base Finetuned Ks
Apache-2.0
該模型是基於facebook/wav2vec2-base在superb數據集上微調的語音識別模型,在關鍵詞識別任務上表現出色。
語音識別
Transformers

W
teoha
14
0
Wav2vec2 Base Finetuned Ie
Apache-2.0
基於facebook/wav2vec2-base模型微調的版本,用於特定任務
語音識別
Transformers

W
minoosh
14
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在評估集上準確率達到87.27%。
語音識別
Transformers

W
FerhatDk
38
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在Google Colab環境下訓練完成。
語音識別
Transformers

W
pannaga
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base的微調版本,主要用於語音識別任務。
語音識別
Transformers

W
ones
108
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別
Transformers

W
Nancyzzz
103
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型,具有較低的詞錯誤率(WER)。
語音識別
Transformers

W
nawta
96
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文字任務
語音識別
Transformers

W
dasolj
127
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調得到的語音識別模型,主要用於英語語音轉文本任務。
語音識別
Transformers

W
neweasterns
100
0
Wav2vec2 Base Ft Cv3 V3
Apache-2.0
該模型是基於facebook/wav2vec2-base在Common Voice 3.0英語數據集上微調的語音識別模型,在測試集上取得了0.247的詞錯誤率。
語音識別
Transformers

W
danieleV9H
120
0
Wav2vec Trained
Apache-2.0
該模型是基於facebook/wav2vec2-base微調而成的語音識別模型,在評估集上取得了詞錯誤率0.1042的表現。
語音識別
Transformers

W
eugenetanjc
70
0
Wav2vec Cv
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型
語音識別
Transformers

W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型,在評估集上詞錯誤率為1.0
語音識別
Transformers

W
eugenetanjc
68
0
Project NLP
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上取得了0.3355的詞錯誤率(WER)。
語音識別
Transformers

P
zakria
22
0
Wav2vec2 Base Dataset Asr Demo Colab
Apache-2.0
這是一個基於distilhubert在superb數據集上微調的語音識別模型,主要用於自動語音識別(ASR)任務。
語音識別
Transformers

W
aminnaghavi
34
0
Test Demo Colab
這是一個自動生成的測試模型,主要用於演示和實驗目的。
大型語言模型
Transformers

T
YYSH
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在評估集上取得了0.3384的詞錯誤率(WER)。
語音識別
Transformers

W
mikeluck
38
0
Wav2vec2 Keyword Spotting Int8
基於wav2vec2架構的語音關鍵詞檢測模型,已通過Optimum OpenVINO進行量化優化
語音識別
Transformers

W
sampras343
17
0
Wac2vec Lllfantomlll
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上取得了0.3417的詞錯誤率。
語音識別
Transformers

W
lllFaNToMlll
27
0
Wav2vec2 Base Vios Commonvoice 1
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice數據集上微調的語音識別模型,支持自動語音識別任務。
語音識別
Transformers

W
tclong
21
0
Wav2vec2 Base Timit Demo Colab53
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,適用於TIMIT數據集
語音識別
Transformers

W
Mudassar
22
0
Wav2vec2 Final 1 Lm 4
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率為0.4499
語音識別
Transformers

W
chrisvinsen
16
0
- 1
- 2
- 3
- 4
- 5
- 6
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98