WebLI預訓練

# WebLI預訓練

Vit So400m Patch16 Siglip Gap 384.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化，移除了注意力池化頭，適用於圖像特徵提取任務。

Vit Giantopt Patch16 Siglip Gap 384.v2 Webli

基於SigLIP 2的ViT圖像編碼器，採用全局平均池化處理，移除了注意力池化頭部，適用於圖像特徵提取任務。

Vit Base Patch32 Siglip Gap 256.v2 Webli

基於SigLIP 2的視覺Transformer模型，使用全局平均池化(GAP)替代注意力池化頭的圖像編碼器

文本生成圖像

Vit Gopt 16 SigLIP2 256

基於WebLI數據集訓練的SigLIP 2視覺語言模型，適用於零樣本圖像分類任務。

文本生成圖像

Vit SO400M 16 SigLIP2 512

基於WebLI數據集訓練的SigLIP 2視覺語言模型，適用於零樣本圖像分類任務

文本生成圖像

Vit SO400M 16 SigLIP2 384

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類任務。

文本生成圖像

Vit SO400M 16 SigLIP2 256

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類

文本生成圖像

Vit SO400M 14 SigLIP2 378

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類任務

文本生成圖像

Vit SO400M 14 SigLIP2

一個在WebLI數據集上訓練的SigLIP 2視覺語言模型，適用於零樣本圖像分類任務。

文本生成圖像

Vit L 16 SigLIP2 512

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類任務

文本生成圖像

Vit L 16 SigLIP2 384

一個在WebLI數據集上訓練的SigLIP 2視覺語言模型，適用於零樣本圖像分類任務。

文本生成圖像

Vit L 16 SigLIP2 256

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類

文本生成圖像

Vit B 16 SigLIP2 512

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類任務

文本生成圖像

Vit B 16 SigLIP2

基於WebLI數據集訓練的SigLIP 2視覺語言模型，適用於零樣本圖像分類任務。

文本生成圖像

Vit B 32 SigLIP2 256

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類任務

文本生成圖像

Vit B 16 SigLIP2 256

基於WebLI數據集訓練的SigLIP 2視覺語言模型，支持零樣本圖像分類任務

文本生成圖像

Siglip2 So400m Patch16 256

SigLIP 2 是基於 SigLIP 的改進模型，整合了多項技術以提升語義理解、定位和密集特徵提取能力。

文本生成圖像

Siglip2 Base Patch16 224

SigLIP 2是基於SigLIP改進的多語言視覺語言編碼器，增強了語義理解、定位和密集特徵提取能力。

圖像生成文本

Siglip So400m Patch16 256 I18n

基於SoViT主幹網絡、採用Sigmoid損失函數改進的多模態模型，支持零樣本圖像分類和圖文檢索

圖像生成文本

Siglip So400m Patch14 384

SigLIP是基於WebLi數據集預訓練的視覺語言模型，採用改進的sigmoid損失函數，優化了圖像-文本匹配任務。

圖像生成文本

Siglip Base Patch16 256 Multilingual

SigLIP是基於WebLi數據集預訓練的改進版CLIP模型，採用Sigmoid損失函數優化圖像-文本匹配任務

文本生成圖像

Siglip Base Patch16 512

SigLIP是基於WebLi數據集預訓練的視覺-語言模型，採用改進的sigmoid損失函數，在圖像分類和圖文檢索任務中表現優異。

文本生成圖像

Vit B 16 SigLIP I18n 256

一個在WebLI數據集上訓練的SigLIP（用於語言-圖像預訓練的Sigmoid損失）模型，適用於零樣本圖像分類任務。

文本生成圖像

Vit SO400M 14 SigLIP 384

基於WebLI數據集訓練的SigLIP（語言-圖像預訓練的Sigmoid損失）模型，適用於零樣本圖像分類任務。

文本生成圖像

Vit SO400M 14 SigLIP

一個在WebLI數據集上訓練的SigLIP（用於語言-圖像預訓練的Sigmoid損失）模型，適用於零樣本圖像分類任務。

文本生成圖像

Vit L 16 SigLIP 384

基於WebLI數據集訓練的SigLIP（Sigmoid Loss for Language-Image Pre-training）模型，用於零樣本圖像分類任務。

文本生成圖像

Vit L 16 SigLIP 256

基於WebLI數據集訓練的SigLIP（語言圖像預訓練的Sigmoid損失）模型，用於零樣本圖像分類任務。

文本生成圖像

Vit B 16 SigLIP 512

基於WebLI數據集訓練的SigLIP（Sigmoid損失語言圖像預訓練）模型，用於零樣本圖像分類任務

文本生成圖像

Vit B 16 SigLIP 384

基於WebLI數據集訓練的SigLIP（Sigmoid損失語言圖像預訓練）模型，用於零樣本圖像分類任務

文本生成圖像

Vit B 16 SigLIP 256

一個在WebLI數據集上訓練的SigLIP（語言-圖像預訓練的Sigmoid損失）模型，適用於零樣本圖像分類任務。

文本生成圖像

Siglip Base Patch16 224

SigLIP是基於WebLi數據集預訓練的視覺語言模型，採用改進的Sigmoid損失函數，優化了圖像-文本匹配任務

圖像生成文本

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase