Focalcodec 25hz
Apache-2.0
基於焦點調製網絡的低比特率語音編解碼器,支持16 kHz語音編碼
語音合成
F
lucadellalib
25
1
Audio Emotion Detection
Apache-2.0
本模型是基於facebook/wav2vec2-large-xlsr-53微調而成的音頻情感檢測模型,可識別7種情感狀態
音頻分類
Transformers

A
Hatman
630
8
Sentis Whisper Tiny
Apache-2.0
Whisper-Tiny是OpenAI開發的一個小型自動語音識別(ASR)模型,專為語音轉文本任務設計,適用於Unity環境。
語音識別
S
unity
253
48
Wav2vec2 French Phonemizer
MIT
這是一個針對法語語音轉音素任務微調的模型,基於facebook/wav2vec2-base-fr-voxpopuli-v2模型,使用Common Voice v13數據集進行訓練。
語音識別
Transformers 法語

W
Cnam-LMSSC
9,832
7
Mms Lid 126
基於Facebook大規模多語言語音項目微調的語言識別模型,支持126種語言的音頻分類
音頻分類
Transformers 支持多種語言

M
facebook
2.1M
26
Wav2vec2 Large Vi Vlsp2020
基於wav2vec2架構的越南語自動語音識別模型,預訓練使用1.3萬小時未標註YouTube音頻,並在250小時標註數據上微調
語音識別
Transformers 其他

W
nguyenvulebinh
385
4
Assignment1 Omar
Apache-2.0
Wav2Vec2是一個基於自監督學習的語音識別模型,在LibriSpeech 960小時語音數據上預訓練和微調,支持英語語音轉錄。
語音識別
Transformers 英語

A
Classroom-workshop
28
0
Wav2vec2 Conformer Rope Large 100h Ft
Apache-2.0
基於Librispeech 100小時語音數據微調的Wav2Vec2 Conformer模型,採用旋轉位置嵌入技術
語音識別
Transformers 英語

W
facebook
99
0
Wav2vec2 Conformer Rel Pos Large 100h Ft
Apache-2.0
採用相對位置嵌入技術的Wav2Vec2-Conformer大型語音識別模型,基於Librispeech 100小時語音數據微調
語音識別
Transformers 英語

W
facebook
99
0
Wav2vec2 Large 10min Lv60 Self
Apache-2.0
該模型是基於Wav2Vec2架構的大規模語音識別模型,在Libri-Light和Librispeech的10分鐘數據上進行了預訓練和微調,使用自訓練目標進行訓練,適用於16kHz採樣率的語音音頻。
語音識別
Transformers 英語

W
Splend1dchan
177
0
Data2vec Audio Large 10m
Apache-2.0
Data2Vec是一個通用的自監督學習框架,適用於語音、視覺和語言任務。該音頻大模型基於Librispeech的10分鐘數據進行預訓練和微調,適用於16kHz採樣的語音音頻。
語音識別
Transformers 英語

D
facebook
19
0
Data2vec Audio Large
Apache-2.0
Data2Vec-Audio-Large是基於16kHz採樣語音音頻預訓練的大型模型,採用自監督學習框架,適用於語音識別等任務。
語音識別
Transformers 英語

D
facebook
97
1
Hubert Base Superb Ks
Apache-2.0
該模型是基於Hubert架構的關鍵詞識別模型,用於將語音片段分類為預定義的關鍵詞集合。
音頻分類
Transformers 英語

H
superb
11.29k
8
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的荷蘭語語音識別模型,在Common Voice和CSS10數據集上訓練,支持16kHz音頻輸入。
語音識別 其他
W
jonatasgrosman
3.0M
12
Wav2vec2 Base 100h
Apache-2.0
Wav2Vec2基礎版是在16kHz採樣的Librispeech語音音頻上進行了100小時預訓練和微調的自動語音識別模型。
語音識別
Transformers 英語

W
facebook
4,380
6
Wav2vec2 Base Bg Voxpopuli V2
基於Facebook Wav2Vec2架構的語音模型,專門針對保加利亞語進行預訓練,適用於語音識別任務。
語音識別
Transformers 其他

W
facebook
30
0
Wav2vec2 Base Lt Voxpopuli V2
這是一個基於Facebook Wav2Vec2架構的語音模型,專門針對立陶宛語進行了預訓練,使用了VoxPopuli語料庫中的14.4k未標記數據。
語音識別
Transformers 其他

W
facebook
31
0
Wav2vec2 Large Superb Er
Apache-2.0
這是一個基於Wav2Vec2-Large模型的情感識別模型,專門用於從語音中識別情感類別。
音頻分類
Transformers 英語

W
superb
1,442
1
Hubert Large Superb Er
Apache-2.0
基於Hubert-Large預訓練模型的情感識別模型,用於預測語音中的情感類別
音頻分類
Transformers 英語

H
superb
10.24k
21
Wav2vec2 Base Superb Er
Apache-2.0
這是一個基於Wav2Vec2架構的語音情感識別模型,移植自S3PRL項目,用於識別語音中的情感類別。
音頻分類
Transformers 英語

W
superb
28.14k
11
Sew D Mid K127 400k Ft Ls100h
Apache-2.0
SEW-D-mid-k127是由ASAPP Research開發的高效語音識別預訓練模型,在性能和效率方面相比wav2vec 2.0有顯著改進。
語音識別
Transformers 英語

S
asapp
16
0
Wav2vec2 Base Et Voxpopuli V2
基於Facebook Wav2Vec2框架的語音模型,專門針對愛沙尼亞語進行預訓練
語音識別
Transformers 其他

W
facebook
30
0
Wav2vec2 Base Pt Voxpopuli V2
基於葡萄牙語VoxPopuli語料庫預訓練的Wav2Vec2基礎模型,適用於語音識別任務
語音識別
Transformers 其他

W
facebook
30
0
Wav2vec2 Large Mt Voxpopuli V2
Facebook的Wav2Vec2大型模型,僅在馬耳他語(mt)上使用VoxPopuli語料庫的未標記數據進行預訓練,適用於語音識別任務。
語音識別
Transformers 其他

W
facebook
25
0
Wav2vec2 Base Lv Voxpopuli V2
基於Facebook Wav2Vec2架構的語音識別基礎模型,專門針對拉脫維亞語(lv)進行預訓練,使用VoxPopuli語料庫的13.1k未標註數據。
語音識別
Transformers 其他

W
facebook
29
1
Wav2vec2 Large Xlsr 53 German
Apache-2.0
基於Facebook的Wav2Vec2架構的大規模德語自動語音識別(ASR)模型,在Common Voice德語數據集上微調
語音識別 德語
W
facebook
1,767
3
Sew D Tiny 100k Ft Ls100h
Apache-2.0
SEW-D-tiny 是由 ASAPP Research 開發的高效語音識別預訓練模型,專注於性能和效率的平衡。
語音識別
Transformers 英語

S
asapp
24.55k
2
Wav2vec2 Base Es Voxpopuli V2
Wav2Vec2基礎模型,僅在西班牙語的21.4k無標註數據上預訓練,適用於語音識別任務。
語音識別
Transformers 西班牙語

W
facebook
46
1
Wav2vec2 Large Romance Voxpopuli V2
Facebook的Wav2Vec2大型模型,僅在羅曼語族的VoxPopuli語料庫101.5小時未標註數據上進行預訓練,適用於語音識別任務。
語音識別
Transformers

W
facebook
26
0
Greek Lsr 1
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在希臘語上微調的自動語音識別模型
語音識別
Transformers 其他

G
skylord
17
0
Wav2vec2 Base En Voxpopuli V2
基於VoxPopuli語料庫的24.1k無標註英語數據預訓練的Wav2Vec2基礎模型,適用於語音識別任務。
語音識別
Transformers 英語

W
facebook
35
1
Wav2vec2 Base Fi Voxpopuli V2
基於Facebook Wav2Vec2架構的語音模型,專門針對芬蘭語進行預訓練,適用於語音識別任務。
語音識別
Transformers 其他

W
facebook
29
1
Wav2vec2 Base Sl Voxpopuli V2
這是一個基於Facebook Wav2Vec2架構的語音模型,專門針對斯洛文尼亞語(sl)進行預訓練,使用了VoxPopuli語料庫中的11.3k未標註數據。
語音識別
Transformers 其他

W
facebook
31
0
Hubert Base Superb Sid
Apache-2.0
基於Hubert的說話人識別模型,針對SUPERB基準任務優化
說話人處理
Transformers 英語

H
superb
673
1
Wav2vec2 Large Xlsr 53 French
Apache-2.0
這是一個基於XLSR-53大模型微調的法語語音識別模型,在Common Voice數據集上訓練,支持高準確率的法語語音轉文本。
語音識別 法語
W
jonatasgrosman
47.83k
11
Wav2vec2 Large 960h Lv60 Self
Apache-2.0
Facebook開發的Wav2Vec2大模型,基於960小時Libri-Light和Librispeech語音數據預訓練和微調,採用自訓練目標,在LibriSpeech測試集上達到SOTA效果。
語音識別 英語
W
facebook
56.00k
146
Unispeech Sat Base 100h Libri Ft
Apache-2.0
基於UniSpeech-SAT基礎模型,在LibriSpeech語音數據上進行了100小時微調的自動語音識別模型
語音識別
Transformers 英語

U
microsoft
643
4
Wav2vec2 Large Xlsr Georgian
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在格魯吉亞語上進行微調的自動語音識別(ASR)模型,使用Common Voice數據集訓練。
語音識別 其他
W
m3hrdadfi
66
5
Wave2vec2 Large Xlsr Hindi
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的印地語語音識別模型,使用OpenSLR和Common Voice印地語數據集訓練,支持16kHz採樣率語音輸入。
語音識別
Transformers 其他

W
shiwangi27
63
1
Wav2vec2 Large Xlsr 53 Rm Vallader
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的羅曼什語瓦拉迪爾方言語音識別模型,詞錯誤率32.89%
語音識別
W
anuragshas
58
0
- 1
- 2
- 3
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98