# 視頻文本對比學習

Xclip Base Patch16 Zero Shot
MIT
X-CLIP是CLIP的極簡擴展,用於通用視頻-語言理解,通過對比學習訓練視頻和文本的匹配關係。
文本生成視頻 Transformers 英語
X
aurelio-ai
22
1
Xclip Large Patch14 Kinetics 600
MIT
X-CLIP是CLIP的擴展版本,用於通用視頻語言理解,通過對比學習在視頻和文本對上訓練。
文本生成視頻 Transformers 英語
X
microsoft
124
5
Xclip Base Patch16 Kinetics 600 16 Frames
MIT
X-CLIP是對CLIP的擴展,用於通用視頻語言理解,支持零樣本、少樣本或全監督的視頻分類以及視頻-文本檢索等任務。
文本生成視頻 Transformers 英語
X
microsoft
393
2
Xclip Base Patch16 Kinetics 600
MIT
X-CLIP是CLIP的擴展版本,用於通用的視頻語言理解,通過對比學習在(視頻,文本)對上訓練。
文本生成視頻 Transformers 英語
X
microsoft
294
1
Xclip Base Patch16 Hmdb 4 Shot
MIT
X-CLIP是CLIP的極簡擴展,用於通用視頻語言理解,通過(視頻,文本)對的對比方式進行訓練。
視頻生成文本 Transformers 英語
X
microsoft
22
1
Xclip Base Patch16 16 Frames
MIT
X-CLIP是對CLIP的極簡擴展,用於通用視頻-語言理解,通過對比學習在(視頻,文本)對上訓練。
文本生成視頻 Transformers 英語
X
microsoft
1,034
0
Xclip Base Patch16
MIT
X-CLIP是CLIP的擴展版本,用於通用視頻語言理解,通過對比學習在(視頻,文本)對上訓練,適用於視頻分類和視頻-文本檢索等任務。
文本生成視頻 Transformers 英語
X
microsoft
1,647
4
Xclip Base Patch32
MIT
X-CLIP是CLIP的擴展版本,用於通用視頻語言理解,通過對比學習在(視頻,文本)對上訓練,適用於視頻分類和視頻-文本檢索等任務。
文本生成視頻 Transformers 英語
X
microsoft
309.80k
84
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase