高精度特徵提取

# 高精度特徵提取

GIST Embedding V0

GIST-Embedding-v0 是一個基於 sentence-transformers 的句子嵌入模型，主要用於句子相似度計算和特徵提取任務。

文本嵌入英語

Vit So400m Patch16 Siglip 512.v2 Webli

基於SigLIP 2的視覺Transformer模型，專為圖像特徵提取設計，適用於多語言視覺-語言任務。

文本生成圖像

Aimv2 Large Patch14 448.apple Pt

AIM-v2是一個基於timm庫的圖像特徵提取模型，採用大尺寸補丁設計，適用於高分辨率圖像處理。

Aimv2 Large Patch14 224.apple Pt Dist

AIM-v2是一個基於timm庫的圖像編碼器，採用蒸餾訓練方法，適用於圖像特徵提取任務。

Aimv2 Huge Patch14 224.apple Pt

AIM-v2是一個高效的圖像編碼器，基於timm庫實現，適用於圖像特徵提取任務。

Vit Base Patch16 Siglip 224.webli

基於SigLIP的視覺Transformer模型，僅包含圖像編碼器部分，採用原始注意力池化機制

Dinov2.large.patch 14.reg 4

DINOv2是一個基於視覺變換器的圖像特徵提取模型，通過引入寄存器機制提升了特徵提取能力。

Dinov2.large.patch 14

DINOv2 large是基於自監督學習的大規模視覺特徵提取模型，能夠生成魯棒的圖像特徵表示。

Cvlface Adaface Vit Base Kprpe Webface12m

基於關鍵點相對位置編碼的人臉識別模型，採用ViT架構並在WebFace12M數據集上訓練

Transformers 英語

Cvlface Arcface Ir101 Webface4m

基於ArcFace損失函數的深度人臉識別模型，使用IR101架構在WebFace4M數據集上訓練

Transformers 英語

Megadescriptor L 384

基於Swin-L架構的圖像特徵模型，專為動物重識別任務設計，在生態學領域有廣泛應用。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase