# 多模態編碼器

Ace Gguf
Apache-2.0
ACE-Step-v1-3.5B是一個文本轉音頻模型,支持高質量音頻生成,適用於音樂和聲音效果創作。
音頻生成
A
calcuis
1,332
12
Siglip2 So400m Patch16 Naflex
Apache-2.0
SigLIP 2 是基於 SigLIP 預訓練目標的改進模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
159.81k
21
Siglip2 So400m Patch16 256
Apache-2.0
SigLIP 2 是基於 SigLIP 的改進模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
2,729
0
Siglip2 Giant Opt Patch16 384
Apache-2.0
SigLIP 2 是基於 SigLIP 預訓練目標的改進模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
26.12k
14
Siglip2 Large Patch16 512
Apache-2.0
SigLIP 2 是基於 SigLIP 的改進模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
4,416
8
Siglip2 Large Patch16 256
Apache-2.0
SigLIP 2 是基於 SigLIP 改進的視覺語言模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
10.89k
3
Siglip2 Base Patch16 512
Apache-2.0
SigLIP 2 是一個視覺語言模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
28.01k
10
Siglip2 Base Patch16 256
Apache-2.0
SigLIP 2是一個多語言視覺語言編碼器,改進了語義理解、定位和密集特徵提取能力。
圖像生成文本 Transformers
S
google
45.24k
4
Siglip2 Base Patch16 224
Apache-2.0
SigLIP 2是基於SigLIP改進的多語言視覺語言編碼器,增強了語義理解、定位和密集特徵提取能力。
圖像生成文本 Transformers
S
google
44.75k
38
Siglip2 Base Patch32 256
Apache-2.0
SigLIP 2 是基於 SigLIP 的改進版本,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
9,419
4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase