PaViT開源圖像識別模型 - 藉助小樣本學習實現精準圖像識別

首頁

Pavit

由Ajibola開發

PaViT是基於Pathway Vision Transformer的圖像識別模型，靈感來源於谷歌的PaLM，專注於小樣本學習技術在圖像識別任務中的應用。

圖像分類支持多種語言開源協議:MIT #小樣本學習 #CPU高效訓練 #自注意力優化

下載量 20

發布時間 : 2/23/2023

模型概述

PaViT是一個用於圖像識別的Vision Transformer模型，旨在展示在小數據集上的高效學習能力。

模型特點

小樣本學習能力

模型在小規模數據集上表現出色，僅用15,000張圖像就達到高準確率

CPU高效訓練

模型設計為可在4GB內存的CPU上高效訓練

可擴展架構

通過增加自注意力頭和線性層可進一步提升性能

模型能力

圖像分類

多類別識別

使用案例

動物識別

寵物分類

識別貓、狗等寵物類別

在3類動物數據集上表現良好

野生動物識別

識別不同種類的野生動物

🚀 路徑視覺變換器（Pathway Vision Transformer）

PaViT 是由 Ajibola Emmanuel Oluwaseun 開發的基於路徑視覺變換器（PaViT）的圖像識別模型。該模型受谷歌的 PaLM（路徑語言模型）啟發，旨在展示少樣本學習技術在圖像識別任務中的潛力。

🚀 快速開始

安裝依賴

#import Libraries
!pip install huggingface_hub["tensorflow"]
import matplotlib.pyplot as plt
import cv2
from huggingface_hub import from_pretrained_keras

推理示例

#load model
model=from_pretrained_keras('Ajibola/PaViT')
#load image
image=cv2.imread('image_path')
image=cv2.resize(image, (224, 224)) #224 is the default image size
image=image/image.max() #Normalize the image to [0-1]
prediction=model.predict(image)
prediction=np.argmax(prediction, axis=-1) #Get Highest probability class

✨ 主要特性

受谷歌 PaLM 啟發，探索少樣本學習技術在圖像識別中的應用。
在 CPU 上訓練速度快，即使使用相對較小的數據集也能取得出色的性能。

📦 安裝指南

使用以下命令安裝所需依賴：

!pip install huggingface_hub["tensorflow"]

💻 使用示例

基礎用法

#import Libraries
!pip install huggingface_hub["tensorflow"]
import matplotlib.pyplot as plt
import cv2
from huggingface_hub import from_pretrained_keras

#load model
model=from_pretrained_keras('Ajibola/PaViT')
#load image
image=cv2.imread('image_path')
image=cv2.resize(image, (224, 224)) #224 is the default image size
image=image/image.max() #Normalize the image to [0-1]
prediction=model.predict(image)
prediction=np.argmax(prediction, axis=-1) #Get Highest probability class

高級用法

可以修改代碼以使用自定義數據集，並通過添加更多自注意力頭和線性層來進一步提高模型的性能。

📚 詳細文檔

模型性能

PaViT 在配備 4GB 內存的 CPU 上使用包含 15 個類別的 15000 張 Kaggle 圖像數據集進行訓練。使用 4 個自注意力頭時，模型達到了驚人的 88% 準確率。當使用 12 個自注意力頭和 12 個線性堆疊的線性層進行訓練時，模型的準確率進一步提高到 96%。這些結果表明，儘管在相對較小的數據集上進行訓練，但該模型在 CPU 上仍具有出色的性能和快速的訓練速度。

上傳的權重是在包含 3 個類（貓、狗和野生動物）的圖像數據集上訓練得到的。