Sam2 Hiera Base Plus.fb R896
Apache-2.0
基於HieraDet圖像編碼器的SAM2模型,專注於圖像特徵提取任務。
圖像分割
Transformers

S
timm
764
0
Dinov2 With Registers Base
Apache-2.0
基於DINOv2訓練的視覺Transformer模型,通過添加寄存器標記優化注意力機制,提升特徵提取能力
圖像分類
Transformers

D
facebook
22.74k
5
Depth Anything V2 Small
Apache-2.0
Depth Anything V2 是目前性能最強的單目深度估計模型,基於大規模合成與真實圖像訓練,相比V1版本能捕捉更精細的細節且更魯棒。
3D視覺 英語
D
depth-anything
55.22k
64
C RADIO
其他
NVIDIA開發的視覺特徵提取模型,用於生成圖像嵌入,支持下游任務如圖像分類。

C
nvidia
398
14
RADIO
由NVIDIA研發的視覺特徵提取模型,可將圖像轉換為嵌入向量供下游任務使用

R
nvidia
5,166
36
Esm1b T33 650M UR50S
MIT
ESM-1b是基於Transformer的蛋白質語言模型,通過無監督學習蛋白質序列數據,可用於蛋白質結構和功能預測。
蛋白質模型
Transformers

E
facebook
24.20k
18
Wav2vec2 Nsc Final 1 Google Colab
基於wav2vec2架構的語音處理模型,訓練細節未完全公開
語音識別
Transformers

W
YuanWellspring
99
0
Assignment1 Omar
Apache-2.0
Wav2Vec2是一個基於自監督學習的語音識別模型,在LibriSpeech 960小時語音數據上預訓練和微調,支持英語語音轉錄。
語音識別
Transformers 英語

A
Classroom-workshop
28
0
Response Quality Classifier Large
MIT
該模型用於評估對話中最後一條消息的相關性和具體性,基於sberbank-ai/ruRoberta-large架構。
對話系統
Transformers 其他

R
t-bank-ai
33
11
Viwav2vec2 Base 1.5k
該模型通過1.5千小時越南語語音數據預訓練得到,適用於越南語語音識別任務,需微調後使用。
語音識別
Transformers 其他

V
dragonSwing
38
0
T5 V1 1 Small
Apache-2.0
T5版本1.1是谷歌改進的文本到文本轉換模型,採用GEGLU激活函數,僅在C4數據集上進行無監督預訓練,需微調後使用。
大型語言模型 英語
T
google
127.68k
26
Mt5 Large
Apache-2.0
mT5是谷歌推出的多語言文本到文本轉換模型,支持101種語言,基於mC4數據集預訓練。
大型語言模型 支持多種語言
M
google
404.82k
90
Wav2vec2 Large 100k Voxpopuli
基於VoxPopuli語料庫10萬條無標註數據預訓練的語音識別模型,支持多語言語音表徵學習
語音識別 其他
W
facebook
2,218
4
Wav2vec2 Large Es Voxpopuli
基於VoxPopuli語料庫西班牙語子集訓練的大型語音預訓練模型,適用於西班牙語語音識別任務
語音識別 西班牙語
W
facebook
117.04k
1
Wav2vec2 Large It Voxpopuli
基於VoxPopuli意大利語無標註數據預訓練的語音識別模型,採用Facebook的Wav2Vec2架構
語音識別 其他
W
facebook
55
0
Wav2vec2 Base Bg Voxpopuli V2
基於Facebook Wav2Vec2架構的語音模型,專門針對保加利亞語進行預訓練,適用於語音識別任務。
語音識別
Transformers 其他

W
facebook
30
0
Wav2vec2 Base Lt Voxpopuli V2
這是一個基於Facebook Wav2Vec2架構的語音模型,專門針對立陶宛語進行了預訓練,使用了VoxPopuli語料庫中的14.4k未標記數據。
語音識別
Transformers 其他

W
facebook
31
0
Wav2vec2 Large Nl Voxpopuli
基於VoxPopuli語料庫荷蘭語子集預訓練的自動語音識別模型
語音識別 其他
W
facebook
18
0
T5 Large Lm Adapt
Apache-2.0
T5版本1.1的LM適配版是基於T5架構改進的文本生成模型,通過語言建模目標額外訓練,提升了提示調優能力。
大型語言模型
Transformers 英語

T
google
501
8
Mt5 Xxl
Apache-2.0
mT5是谷歌推出的多語言文本到文本轉換模型,支持101種語言,基於mC4數據集預訓練,適用於多種NLP任務。
大型語言模型
Transformers 支持多種語言

M
google
7,532
68
Wav2vec2 Base Et Voxpopuli V2
基於Facebook Wav2Vec2框架的語音模型,專門針對愛沙尼亞語進行預訓練
語音識別
Transformers 其他

W
facebook
30
0
Wav2vec2 Base Sv Voxpopuli
基於VoxPopuli語料庫瑞典語子集預訓練的Wav2Vec2基礎模型,適用於瑞典語語音識別任務。
語音識別
Transformers 其他

W
facebook
33
0
Wav2vec2 Base Pt Voxpopuli V2
基於葡萄牙語VoxPopuli語料庫預訓練的Wav2Vec2基礎模型,適用於語音識別任務
語音識別
Transformers 其他

W
facebook
30
0
Wav2vec2 Large Fr Voxpopuli
基於VoxPopuli法語語料庫預訓練的大型語音識別模型,支持法語語音轉文本任務
語音識別 法語
W
facebook
31
0
Wav2vec2 Large Mt Voxpopuli V2
Facebook的Wav2Vec2大型模型,僅在馬耳他語(mt)上使用VoxPopuli語料庫的未標記數據進行預訓練,適用於語音識別任務。
語音識別
Transformers 其他

W
facebook
25
0
Wav2vec2 Base Lv Voxpopuli V2
基於Facebook Wav2Vec2架構的語音識別基礎模型,專門針對拉脫維亞語(lv)進行預訓練,使用VoxPopuli語料庫的13.1k未標註數據。
語音識別
Transformers 其他

W
facebook
29
1
T5 V1 1 Xl
Apache-2.0
T5 1.1是谷歌改進的文本到文本轉換Transformer模型,採用GEGLU激活函數和優化架構,僅使用C4數據集進行無監督預訓練
大型語言模型
Transformers 英語

T
google
30.17k
15
Wav2vec2 Base Es Voxpopuli V2
Wav2Vec2基礎模型,僅在西班牙語的21.4k無標註數據上預訓練,適用於語音識別任務。
語音識別
Transformers 西班牙語

W
facebook
46
1
Wav2vec2 Large Romance Voxpopuli V2
Facebook的Wav2Vec2大型模型,僅在羅曼語族的VoxPopuli語料庫101.5小時未標註數據上進行預訓練,適用於語音識別任務。
語音識別
Transformers

W
facebook
26
0
Wav2vec2 Large El Voxpopuli V2
基於VoxPopuli語料庫預訓練的希臘語語音識別模型,使用17.7小時未標註數據
語音識別
Transformers 其他

W
facebook
24
0
Wav2vec2 Base Fi Voxpopuli V2
基於Facebook Wav2Vec2架構的語音模型,專門針對芬蘭語進行預訓練,適用於語音識別任務。
語音識別
Transformers 其他

W
facebook
29
1
Wav2vec2 Base Sl Voxpopuli V2
這是一個基於Facebook Wav2Vec2架構的語音模型,專門針對斯洛文尼亞語(sl)進行預訓練,使用了VoxPopuli語料庫中的11.3k未標註數據。
語音識別
Transformers 其他

W
facebook
31
0
Wav2vec2 Base 10k Voxpopuli
基於VoxPopuli語料庫1萬條未標註數據預訓練的語音識別基礎模型,支持多語言語音處理
語音識別
Transformers 其他

W
facebook
2,504
0
T5 V1 1 Base
Apache-2.0
T5 1.1是谷歌改進的文本到文本轉換模型,採用GEGLU激活函數和優化架構,專注於無監督預訓練
大型語言模型 英語
T
google
150.73k
58
Wav2vec2 Base It Voxpopuli
基於VoxPopuli意大利語無標註數據預訓練的Wav2Vec2基礎模型,適用於語音識別任務。
語音識別
Transformers 其他

W
facebook
32
0
Wav2vec2 Base Nl Voxpopuli
基於VoxPopuli語料庫荷蘭語子集預訓練的Wav2Vec2基礎模型,適用於荷蘭語語音識別任務。
語音識別
Transformers 其他

W
facebook
31
0
Wav2vec2 Base Fr Voxpopuli
基於VoxPopuli法語無標註數據預訓練的Wav2Vec2基礎模型,適用於法語語音識別任務
語音識別
Transformers 法語

W
facebook
30
0
Wav2vec2 Large West Germanic Voxpopuli V2
Facebook的Wav2Vec2大型模型,僅在西日耳曼語系的VoxPopuli語料庫66.3無標註數據上進行預訓練。
語音識別
Transformers

W
facebook
25
1
Wav2vec2 Base Es Voxpopuli
基於VoxPopuli西班牙語無標註數據預訓練的Wav2Vec2語音識別基礎模型
語音識別
Transformers 西班牙語

W
facebook
39
2
Wav2vec2 Base De Voxpopuli V2
基於Facebook Wav2Vec2架構的德語語音預訓練模型,使用VoxPopuli語料庫中的23.2k未標註德語數據進行預訓練。
語音識別
Transformers 德語

W
facebook
44
1
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98