# 語音識別

Ultravox V0 5 Llama 3 2 1b GGUF
MIT
Ultravox v0.5是基於Llama-3 2.1B架構優化的音頻文本轉文本模型,專注於高效處理語音轉寫任務。
語音識別
U
ggml-org
421
1
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型,在評估集上取得了0.3174的詞錯誤率。
語音識別 Transformers
W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
基於facebook/hubert-large-ls960-ft微調的語音識別模型,在LibriSpeech數據集上訓練
語音識別 Transformers
H
vishwasgautam
101
0
Wav2vec Checkpoints
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上準確率達99.48%
語音識別 Transformers
W
Zeyadd-Mostaffa
19
0
Deepfake Audio Detection
Apache-2.0
基於wav2vec2-base-finetuned進一步微調的語音處理模型,在評估集上準確率達98.82%
語音識別 Transformers
D
motheecreator
1,468
7
Deepfake Audio Detection
Apache-2.0
基於wav2vec2-base-finetuned模型微調的語音處理模型,在評估集上準確率達98.82%
語音識別 Transformers
D
mo-thecreator
801
7
Wav2vec2 Phoneme
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型,專注於音素識別任務
語音識別 Transformers
W
Bluecast
189
3
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上達到99.97%的準確率
語音識別 Transformers
W
mo-thecreator
19
4
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上準確率達99.97%
語音識別 Transformers
W
motheecreator
105
4
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於wav2vec2-base模型在音頻文件夾數據集上微調的音頻分類模型,驗證集準確率達99.82%
音頻分類 Transformers
W
motheecreator
54
3
Whisper Small Dialect Classifier Cross
Apache-2.0
該模型是基於whisper-small架構的方言分類器,用於識別和分類特定方言的語音輸入。
音頻分類 Transformers
W
yaygomii
53
1
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上表現出色
語音識別 Transformers
B
Juardo
19
0
Neunit Ks Kangyuan0601
Apache-2.0
該模型是基於facebook/wav2vec2-base在superb數據集上微調的音頻分類模型,在評估集上取得了99.87%的準確率。
音頻分類 Transformers
N
SHENMU007
16
0
Wav2vec2 Base Finetuned Amd
Apache-2.0
該模型是基於facebook/wav2vec2-base在未知數據集上微調的版本,主要用於語音識別任務,在評估集上達到84.55%的準確率。
語音識別 Transformers
W
justin1983
14
0
Audio Class Finetuned
Apache-2.0
該模型是基於facebook/wav2vec2-base在superb數據集上微調的音頻分類模型,在評估集上取得了0.6578的準確率。
音頻分類 Transformers
A
Chemsseddine
20
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於facebook/wav2vec2-base在superb數據集上微調的語音識別模型,準確率達98.34%
語音識別 Transformers
W
marcatanante1
13
0
Whisper Small ISSAI KSC 335RS V2
基於Whisper架構的小型語音識別模型,適用於特定領域的語音轉文本任務
語音識別 Transformers
W
Shirali
83
1
Englishmodel
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m微調的語音識別模型,主要用於英語語音轉文本任務。
語音識別 Transformers
E
Foxasdf
24
1
Wav2vec2 Base Finetuned Ks
Apache-2.0
該模型是基於facebook/wav2vec2-base在superb數據集上微調的語音識別模型,在關鍵詞識別任務上表現出色。
語音識別 Transformers
W
teoha
14
0
Wav2vec2 Base Finetuned Ie
Apache-2.0
基於facebook/wav2vec2-base模型微調的版本,用於特定任務
語音識別 Transformers
W
minoosh
14
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在評估集上準確率達到87.27%。
語音識別 Transformers
W
FerhatDk
38
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在Google Colab環境下訓練完成。
語音識別 Transformers
W
pannaga
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base的微調版本,主要用於語音識別任務。
語音識別 Transformers
W
ones
108
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型
語音識別 Transformers
W
Nancyzzz
103
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型在TIMIT數據集上微調的語音識別模型,具有較低的詞錯誤率(WER)。
語音識別 Transformers
W
nawta
96
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,專注於英語語音轉文字任務
語音識別 Transformers
W
dasolj
127
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調得到的語音識別模型,主要用於英語語音轉文本任務。
語音識別 Transformers
W
neweasterns
100
0
Wav2vec2 Base Ft Cv3 V3
Apache-2.0
該模型是基於facebook/wav2vec2-base在Common Voice 3.0英語數據集上微調的語音識別模型,在測試集上取得了0.247的詞錯誤率。
語音識別 Transformers
W
danieleV9H
120
0
Wav2vec Trained
Apache-2.0
該模型是基於facebook/wav2vec2-base微調而成的語音識別模型,在評估集上取得了詞錯誤率0.1042的表現。
語音識別 Transformers
W
eugenetanjc
70
0
Wav2vec Cv
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型
語音識別 Transformers
W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型,在評估集上詞錯誤率為1.0
語音識別 Transformers
W
eugenetanjc
68
0
Project NLP
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上取得了0.3355的詞錯誤率(WER)。
語音識別 Transformers
P
zakria
22
0
Wav2vec2 Base Dataset Asr Demo Colab
Apache-2.0
這是一個基於distilhubert在superb數據集上微調的語音識別模型,主要用於自動語音識別(ASR)任務。
語音識別 Transformers
W
aminnaghavi
34
0
Test Demo Colab
這是一個自動生成的測試模型,主要用於演示和實驗目的。
大型語言模型 Transformers
T
YYSH
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,在評估集上取得了0.3384的詞錯誤率(WER)。
語音識別 Transformers
W
mikeluck
38
0
Wav2vec2 Keyword Spotting Int8
基於wav2vec2架構的語音關鍵詞檢測模型,已通過Optimum OpenVINO進行量化優化
語音識別 Transformers
W
sampras343
17
0
Wac2vec Lllfantomlll
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上取得了0.3417的詞錯誤率。
語音識別 Transformers
W
lllFaNToMlll
27
0
Wav2vec2 Base Vios Commonvoice 1
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice數據集上微調的語音識別模型,支持自動語音識別任務。
語音識別 Transformers
W
tclong
21
0
Wav2vec2 Base Timit Demo Colab53
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,適用於TIMIT數據集
語音識別 Transformers
W
Mudassar
22
0
Wav2vec2 Final 1 Lm 4
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率為0.4499
語音識別 Transformers
W
chrisvinsen
16
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase