Geometric-Shapes-Classification开源图像分类模型，免费精准识别8种基本几何形状

首页

Geometric Shapes Classification

由 prithivMLmods 开发

基于SigLIP2微调的图像分类模型，专用于识别8种基本几何形状

图像分类

Transformers

支持多种语言开源协议:Apache-2.0 #高精度形状识别 #教育辅助工具 #SigLIP2架构

下载量 159

发布时间 : 4/4/2025

模型简介

该模型采用SiglipForImageClassification架构，可准确分类圆形、风筝形、平行四边形、长方形、菱形、正方形、梯形和三角形等几何形状。

模型特点

高精度分类

在8类形状识别任务中达到99.08%的准确率

符号化输出

分类结果附带几何符号标识（如◯▲◼等）

教育友好

特别适合几何教学场景的视觉识别

模型能力

几何形状识别

图像分类

视觉特征提取

使用案例

教育

几何教学辅助

自动识别并标注教学材料中的几何形状

提升几何概念可视化教学效率

计算机视觉

工程图纸分析

识别技术图纸中的基本几何元素

准确率超过99%的形状分类

🚀 几何形状分类模型

本项目的几何形状分类模型是一个图像分类的视觉语言编码器模型，它基于 google/siglip2-base-patch16-224 进行微调，用于多类形状识别任务。该模型使用 SiglipForImageClassification 架构对各种几何形状进行分类。

🚀 快速开始

安装依赖

!pip install -q transformers torch pillow gradio

运行代码

import gradio as gr
from transformers import AutoImageProcessor
from transformers import SiglipForImageClassification
from PIL import Image
import torch

# Load model and processor
model_name = "prithivMLmods/Geometric-Shapes-Classification"
model = SiglipForImageClassification.from_pretrained(model_name)
processor = AutoImageProcessor.from_pretrained(model_name)

# Label mapping with symbols
labels = {
    "0": "Circle ◯",
    "1": "Kite ⬰",
    "2": "Parallelogram ▰",
    "3": "Rectangle ▭",
    "4": "Rhombus ◆",
    "5": "Square ◼",
    "6": "Trapezoid ⏢",
    "7": "Triangle ▲"
}

def classify_shape(image):
    """Classifies the geometric shape in the input image."""
    image = Image.fromarray(image).convert("RGB")
    inputs = processor(images=image, return_tensors="pt")

    with torch.no_grad():
        outputs = model(**inputs)
        logits = outputs.logits
        probs = torch.nn.functional.softmax(logits, dim=1).squeeze().tolist()

    predictions = {labels[str(i)]: round(probs[i], 3) for i in range(len(probs))}
    
    return predictions

# Gradio interface
iface = gr.Interface(
    fn=classify_shape,
    inputs=gr.Image(type="numpy"),
    outputs=gr.Label(label="Prediction Scores"),
    title="Geometric Shapes Classification",
    description="Upload an image to classify geometric shapes such as circle, triangle, square, and more."
)

# Launch the app
if __name__ == "__main__":
    iface.launch()

💻 使用示例

基础用法

# 以下代码展示了如何使用该模型进行几何形状分类
import gradio as gr
from transformers import AutoImageProcessor
from transformers import SiglipForImageClassification
from PIL import Image
import torch

# 加载模型和处理器
model_name = "prithivMLmods/Geometric-Shapes-Classification"
model = SiglipForImageClassification.from_pretrained(model_name)
processor = AutoImageProcessor.from_pretrained(model_name)

# 带有符号的标签映射
labels = {
    "0": "Circle ◯",
    "1": "Kite ⬰",
    "2": "Parallelogram ▰",
    "3": "Rectangle ▭",
    "4": "Rhombus ◆",
    "5": "Square ◼",
    "6": "Trapezoid ⏢",
    "7": "Triangle ▲"
}

def classify_shape(image):
    """对输入图像中的几何形状进行分类。"""
    image = Image.fromarray(image).convert("RGB")
    inputs = processor(images=image, return_tensors="pt")

    with torch.no_grad():
        outputs = model(**inputs)
        logits = outputs.logits
        probs = torch.nn.functional.softmax(logits, dim=1).squeeze().tolist()

    predictions = {labels[str(i)]: round(probs[i], 3) for i in range(len(probs))}
    
    return predictions

# Gradio 界面
iface = gr.Interface(
    fn=classify_shape,
    inputs=gr.Image(type="numpy"),
    outputs=gr.Label(label="Prediction Scores"),
    title="Geometric Shapes Classification",
    description="上传一张图像，对圆形、三角形、正方形等几何形状进行分类。"
)

# 启动应用
if __name__ == "__main__":
    iface.launch()

📚 详细文档

分类报告

Classification Report:
                 precision    recall  f1-score   support

       Circle ◯     0.9921    0.9987    0.9953      1500
         Kite ⬰     0.9927    0.9927    0.9927      1500
Parallelogram ▰     0.9926    0.9840    0.9883      1500
    Rectangle ▭     0.9993    0.9913    0.9953      1500
      Rhombus ◆     0.9846    0.9820    0.9833      1500
       Square ◼     0.9914    0.9987    0.9950      1500
    Trapezoid ⏢     0.9966    0.9793    0.9879      1500
     Triangle ▲     0.9772    0.9993    0.9881      1500

       accuracy                         0.9908     12000
      macro avg     0.9908    0.9908    0.9907     12000
   weighted avg     0.9908    0.9908    0.9907     12000

模型分类的类别

该模型将图像分类为以下类别：

类别 0：圆形 ◯
类别 1：风筝形 ⬰
类别 2：平行四边形 ▰
类别 3：矩形 ▭
类别 4：菱形 ◆
类别 5：正方形 ◼
类别 6：梯形 ⏢
类别 7：三角形 ▲

预期用途

几何形状分类 模型旨在识别图像中的基本几何形状。示例用例如下：

教育工具：用于以可视化方式学习和教授几何知识。
计算机视觉项目：作为机器人或自动化中的形状检测器。
图像分析：识别图表或工程图纸中的符号。
辅助技术：支持视障应用中的形状识别。

📄 许可证

本项目采用 Apache-2.0 许可证。

📦 模型信息

属性	详情
模型类型	图像分类视觉语言编码器模型
基础模型	google/siglip2-base-patch16-224
训练数据集	prithivMLmods/Math-Shapes
库名称	transformers
标签	Shapes、Geometric、SigLIP2、art
管道标签	图像分类