全局平均池化

# 全局平均池化

Vit So400m Patch16 Siglip Gap 384.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化，移除了注意力池化頭，適用於圖像特徵提取任務。

Vit So400m Patch16 Siglip Gap 256.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化，移除了注意力池化頭，適用於圖像特徵提取任務。

文本生成圖像

Vit So400m Patch14 Siglip Gap 378.v2 Webli

基於SigLIP 2架構的視覺Transformer模型，使用WebLI數據集預訓練，移除了注意力池化頭並採用全局平均池化

Vit So400m Patch14 Siglip Gap 224.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化，移除了注意力池化頭，適用於圖像特徵提取任務。

Vit Large Patch16 Siglip Gap 512.v2 Webli

基於SigLIP 2架構的視覺Transformer模型，專為圖像特徵提取設計，採用全局平均池化(GAP)替代注意力池化頭部

Vit Large Patch16 Siglip Gap 384.v2 Webli

基於SigLIP 2架構的視覺Transformer模型，採用全局平均池化(GAP)的變體，移除了注意力池化頭，適用於圖像特徵提取任務。

文本生成圖像

Vit Giantopt Patch16 Siglip Gap 384.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化處理，移除了注意力池化頭部，適用於圖像特徵提取任務。

Vit Giantopt Patch16 Siglip Gap 256.v2 Webli

SigLIP 2 ViT圖像編碼器，採用全局平均池化，移除了注意力池化頭，專為timm設計

Vit Base Patch32 Siglip Gap 256.v2 Webli

基於SigLIP 2的視覺Transformer模型，使用全局平均池化(GAP)替代注意力池化頭的圖像編碼器

文本生成圖像

Vit Base Patch16 Siglip Gap 512.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化，移除了注意力池化頭，適用於圖像特徵提取任務。

Vit Base Patch16 Siglip Gap 384.v2 Webli

基於SigLIP 2的ViT圖像編碼器，使用全局平均池化(GAP)替代注意力池化頭，適用於圖像特徵提取任務。

Vit Base Patch16 Siglip Gap 256.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化，移除注意力池化頭，適用於圖像特徵提取。

多模態融合

Vit Base Patch16 Siglip Gap 224.v2 Webli

基於SigLIP 2的視覺變換器模型，採用全局平均池化處理圖像特徵

Vit So400m Patch16 Siglip Gap 512.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化處理，適用於視覺語言任務。

文本生成圖像

Vit So400m Patch14 Siglip Gap 896.pali Pt

基於SigLIP圖像編碼器的視覺模型，採用全局平均池化，是PaliGemma項目的一部分

文本生成圖像

Vit So400m Patch14 Siglip Gap 896.pali2 3b Pt

基於SigLIP圖像編碼器的視覺模型，採用全局平均池化，是PaliGemma2項目的一部分

文本生成圖像

Vit So400m Patch14 Siglip Gap 448.pali Mix

基於SigLIP圖像編碼器的視覺語言模型，採用全局平均池化處理，適用於多模態任務。

文本生成圖像

Vit Large Patch16 Siglip Gap 384.webli

基於SigLIP的視覺Transformer模型，採用全局平均池化，適用於圖像特徵提取任務。

Vit Base Patch16 Siglip Gap 224.webli

基於SigLIP的視覺Transformer模型，僅包含圖像編碼器部分，採用全局平均池化策略

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase