大規模視覺編碼

# 大規模視覺編碼

Siglip2 Giant Opt Patch16 256

SigLIP 2 是一個先進的視覺語言模型，整合了多項技術以提升語義理解、定位和密集特徵提取能力。

文本生成圖像

Aimv2 3b Patch14 224.apple Pt

AIM-v2是一個高效的圖像編碼器模型，兼容timm框架，適用於計算機視覺任務。

Aimv2 Large Patch14 224 Distilled

AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列，在多模態理解基準測試中表現優異。

Aimv2 3B Patch14 448

AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列，在多個視覺理解基準測試中表現優異。

Aimv2 1B Patch14 448

AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列，在多個視覺理解基準測試中表現優異。

Aimv2 Huge Patch14 448

AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列，在多個基準測試中表現優異。

Aimv2 Large Patch14 448

AIMv2是基於多模態自迴歸目標預訓練的視覺模型系列，在多個基準測試中表現優異

Aimv2 3B Patch14 336

AIMv2 是一個通過多模態自迴歸目標預訓練的視覺模型系列，在多個多模態理解基準測試中表現優異。

Aimv2 Large Patch14 336

AIMv2是基於多模態自迴歸目標預訓練的視覺模型系列，在多項視覺任務中表現優異。

Aimv2 1B Patch14 224

AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列，在多項視覺任務中表現優異。

Aimv2 Huge Patch14 224

AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列，在多項基準測試中表現優異。

Aimv2 Large Patch14 224

AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列，在多項視覺任務中表現優異。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase