PaViT开源图像识别模型 - 借助小样本学习实现精准图像识别

首页

Pavit

由 Ajibola 开发

PaViT是基于Pathway Vision Transformer的图像识别模型，灵感来源于谷歌的PaLM，专注于小样本学习技术在图像识别任务中的应用。

图像分类支持多种语言开源协议:MIT #小样本学习 #CPU高效训练 #自注意力优化

下载量 20

发布时间 : 2/23/2023

模型简介

PaViT是一个用于图像识别的Vision Transformer模型，旨在展示在小数据集上的高效学习能力。

模型特点

小样本学习能力

模型在小规模数据集上表现出色，仅用15,000张图像就达到高准确率

CPU高效训练

模型设计为可在4GB内存的CPU上高效训练

可扩展架构

通过增加自注意力头和线性层可进一步提升性能

模型能力

图像分类

多类别识别

使用案例

动物识别

宠物分类

识别猫、狗等宠物类别

在3类动物数据集上表现良好

野生动物识别

识别不同种类的野生动物

🚀 路径视觉变换器（Pathway Vision Transformer）

PaViT 是由 Ajibola Emmanuel Oluwaseun 开发的基于路径视觉变换器（PaViT）的图像识别模型。该模型受谷歌的 PaLM（路径语言模型）启发，旨在展示少样本学习技术在图像识别任务中的潜力。

🚀 快速开始

安装依赖

#import Libraries
!pip install huggingface_hub["tensorflow"]
import matplotlib.pyplot as plt
import cv2
from huggingface_hub import from_pretrained_keras

推理示例

#load model
model=from_pretrained_keras('Ajibola/PaViT')
#load image
image=cv2.imread('image_path')
image=cv2.resize(image, (224, 224)) #224 is the default image size
image=image/image.max() #Normalize the image to [0-1]
prediction=model.predict(image)
prediction=np.argmax(prediction, axis=-1) #Get Highest probability class

✨ 主要特性

受谷歌 PaLM 启发，探索少样本学习技术在图像识别中的应用。
在 CPU 上训练速度快，即使使用相对较小的数据集也能取得出色的性能。

📦 安装指南

使用以下命令安装所需依赖：

!pip install huggingface_hub["tensorflow"]

💻 使用示例

基础用法

#import Libraries
!pip install huggingface_hub["tensorflow"]
import matplotlib.pyplot as plt
import cv2
from huggingface_hub import from_pretrained_keras

#load model
model=from_pretrained_keras('Ajibola/PaViT')
#load image
image=cv2.imread('image_path')
image=cv2.resize(image, (224, 224)) #224 is the default image size
image=image/image.max() #Normalize the image to [0-1]
prediction=model.predict(image)
prediction=np.argmax(prediction, axis=-1) #Get Highest probability class

高级用法

可以修改代码以使用自定义数据集，并通过添加更多自注意力头和线性层来进一步提高模型的性能。

📚 详细文档

模型性能

PaViT 在配备 4GB 内存的 CPU 上使用包含 15 个类别的 15000 张 Kaggle 图像数据集进行训练。使用 4 个自注意力头时，模型达到了惊人的 88% 准确率。当使用 12 个自注意力头和 12 个线性堆叠的线性层进行训练时，模型的准确率进一步提高到 96%。这些结果表明，尽管在相对较小的数据集上进行训练，但该模型在 CPU 上仍具有出色的性能和快速的训练速度。

上传的权重是在包含 3 个类（猫、狗和野生动物）的图像数据集上训练得到的。