P

Pavit

由Ajibola開發
PaViT是基於Pathway Vision Transformer的圖像識別模型,靈感來源於谷歌的PaLM,專注於小樣本學習技術在圖像識別任務中的應用。
下載量 20
發布時間 : 2/23/2023

模型概述

PaViT是一個用於圖像識別的Vision Transformer模型,旨在展示在小數據集上的高效學習能力。

模型特點

小樣本學習能力
模型在小規模數據集上表現出色,僅用15,000張圖像就達到高準確率
CPU高效訓練
模型設計為可在4GB內存的CPU上高效訓練
可擴展架構
通過增加自注意力頭和線性層可進一步提升性能

模型能力

圖像分類
多類別識別

使用案例

動物識別
寵物分類
識別貓、狗等寵物類別
在3類動物數據集上表現良好
野生動物識別
識別不同種類的野生動物
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase