Test With Sdfvd
基於MCG-NJU/videomae-base微調的視頻理解模型,在評估集上表現一般(準確率50%)
視頻處理
Transformers

T
cocovani
16
0
Datatrain Videomae Base Finetuned Lr1e 07 Poly3
基於MCG-NJU/videomae-base微調的視頻理解模型,在未知數據集上訓練,準確率為11.1%
視頻處理
Transformers

D
EloiseInacio
13
0
Videomae Base Finetuned 1e 08 Bs4 Ep2
基於MCG-NJU/videomae-base微調的視頻理解模型,在未知數據集上進行了訓練
視頻處理
Transformers

V
EloiseInacio
14
0
Sign Language Classification V1
Apache-2.0
基於Google Vision Transformer (ViT)微調的手語分類模型,準確率達80.56%
圖像分類
Transformers

S
joseluhf11
40
2
Videomae Base Ipm All Videos
基於VideoMAE基礎模型在未知視頻數據集上微調的視覺模型,主要用於視頻理解任務,在評估集上達到85.59%的準確率。
視頻處理
Transformers

V
rickysk
30
0
Videomae Huge Finetuned Kinetics
VideoMAE是基於掩碼自編碼器(MAE)的視頻預訓練模型,通過自監督學習在Kinetics-400數據集上微調,適用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
2,984
4
Videomae Base Finetuned
基於MCG-NJU/videomae-base在未知數據集上微調的視頻理解模型,F1分數達到0.7147
視頻處理
Transformers

V
sheraz179
15
0
Timesformer Hr Finetuned K400
TimeSformer是一種基於空間-時間注意力機制的視頻理解模型,在Kinetics-400數據集上進行了預訓練和微調。
視頻處理
Transformers

T
facebook
178
2
Xclip Base Patch16 Hmdb 16 Shot
MIT
X-CLIP是CLIP的擴展版本,用於通用視頻語言理解,支持視頻分類和視頻-文本檢索任務。
視頻處理
Transformers 英語

X
microsoft
49
0
Xclip Base Patch16 Hmdb 8 Shot
MIT
X-CLIP是CLIP的擴展版本,用於通用視頻-語言理解,通過對比學習在視頻和文本對上訓練,適用於視頻分類和視頻-文本檢索任務。
文本生成視頻
Transformers 英語

X
microsoft
17
1
Xclip Base Patch16 Hmdb 4 Shot
MIT
X-CLIP是CLIP的極簡擴展,用於通用視頻語言理解,通過(視頻,文本)對的對比方式進行訓練。
視頻生成文本
Transformers 英語

X
microsoft
22
1
Xclip Base Patch16 Hmdb 2 Shot
MIT
X-CLIP是CLIP的擴展版本,用於通用視頻語言理解,通過對比學習在視頻和文本對上訓練,支持零樣本、少樣本和全監督的視頻分類任務。
文本生成視頻
Transformers 英語

X
microsoft
19
0
Finetuned ViT Indian Food Classification V3
Apache-2.0
該模型是基於google/vit-base-patch16-224-in21k在Human_Action_Recognition數據集上微調的圖像分類模型,準確率達到93.84%。
圖像分類
Transformers

F
DrishtiSharma
60
2
Videomae Base Finetuned Ssv2
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,在Something-Something-v2數據集上微調用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
951
6
Videomae Base Finetuned Kinetics
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,在Kinetics-400數據集上微調後可用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
44.91k
34
Video Classification Cnn Rnn
基於CNN-RNN混合架構的視頻分類模型,用於動作識別任務
視頻處理
V
keras-io
57
14
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98