🚀 幾何形状分類
幾何形状分類は、多クラス形状認識タスク用にgoogle/siglip2-base-patch16-224からファインチューニングされた画像分類のビジョン言語エンコーダモデルです。SiglipForImageClassificationアーキテクチャを使用して、さまざまな幾何学的形状を分類します。

🚀 クイックスタート
分類レポート
Classification Report:
precision recall f1-score support
Circle ◯ 0.9921 0.9987 0.9953 1500
Kite ⬰ 0.9927 0.9927 0.9927 1500
Parallelogram ▰ 0.9926 0.9840 0.9883 1500
Rectangle ▭ 0.9993 0.9913 0.9953 1500
Rhombus ◆ 0.9846 0.9820 0.9833 1500
Square ◼ 0.9914 0.9987 0.9950 1500
Trapezoid ⏢ 0.9966 0.9793 0.9879 1500
Triangle ▲ 0.9772 0.9993 0.9881 1500
accuracy 0.9908 12000
macro avg 0.9908 0.9908 0.9907 12000
weighted avg 0.9908 0.9908 0.9907 12000
分類される形状クラス
このモデルは、画像を以下のクラスに分類します。
- クラス0: 円 ◯
- クラス1: 凧形 ⬰
- クラス2: 平行四辺形 ▰
- クラス3: 長方形 ▭
- クラス4: 菱形 ◆
- クラス5: 正方形 ◼
- クラス6: 台形 ⏢
- クラス7: 三角形 ▲

📦 インストール
!pip install -q transformers torch pillow gradio
💻 使用例
基本的な使用法
import gradio as gr
from transformers import AutoImageProcessor
from transformers import SiglipForImageClassification
from PIL import Image
import torch
model_name = "prithivMLmods/Geometric-Shapes-Classification"
model = SiglipForImageClassification.from_pretrained(model_name)
processor = AutoImageProcessor.from_pretrained(model_name)
labels = {
"0": "Circle ◯",
"1": "Kite ⬰",
"2": "Parallelogram ▰",
"3": "Rectangle ▭",
"4": "Rhombus ◆",
"5": "Square ◼",
"6": "Trapezoid ⏢",
"7": "Triangle ▲"
}
def classify_shape(image):
"""入力画像の幾何形状を分類する。"""
image = Image.fromarray(image).convert("RGB")
inputs = processor(images=image, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
probs = torch.nn.functional.softmax(logits, dim=1).squeeze().tolist()
predictions = {labels[str(i)]: round(probs[i], 3) for i in range(len(probs))}
return predictions
iface = gr.Interface(
fn=classify_shape,
inputs=gr.Image(type="numpy"),
outputs=gr.Label(label="Prediction Scores"),
title="Geometric Shapes Classification",
description="Upload an image to classify geometric shapes such as circle, triangle, square, and more."
)
if __name__ == "__main__":
iface.launch()
📚 ドキュメント
想定される用途
幾何形状分類モデルは、画像内の基本的な幾何形状を認識するように設計されています。以下は想定される使用例です。
- 教育ツール: 幾何学を視覚的に学習および教授するために使用できます。
- コンピュータビジョンプロジェクト: ロボット工学や自動化における形状検出器として利用できます。
- 画像分析: 図面やエンジニアリングドラフト内のシンボルを認識するために使用できます。
- 支援技術: 視覚障害者向けのアプリケーションにおける形状識別をサポートします。
📄 ライセンス
このモデルはApache-2.0ライセンスの下で提供されています。
属性 |
详情 |
モデルタイプ |
画像分類 |
ベースモデル |
google/siglip2-base-patch16-224 |
パイプラインタグ |
画像分類 |
ライブラリ名 |
transformers |
データセット |
prithivMLmods/Math-Shapes |
タグ |
Shapes、Geometric、SigLIP2、art |