🚀 Segformer B3 衣類セグメンテーション用にファインチューニングされたモデル
このSegFormerモデルは、ATRデータセットを使用して衣類セグメンテーション用にファインチューニングされていますが、人体セグメンテーションにも使用できます。Hugging Face上のデータセットは「mattmdjaga/human_parsing_dataset」と呼ばれています。
新着 -
学習コード。現在はコメント付きの純粋なコードのみですが、すぐにColabノートブック版とブログ記事を追加して、使いやすくします。
🚀 クイックスタート
💻 使用例
基本的な使用法
from transformers import SegformerImageProcessor, AutoModelForSemanticSegmentation
from PIL import Image
import requests
import matplotlib.pyplot as plt
import torch.nn as nn
processor = SegformerImageProcessor.from_pretrained("sayeed99/segformer_b3_clothes")
model = AutoModelForSemanticSegmentation.from_pretrained("sayeed99/segformer_b3_clothes")
url = "https://plus.unsplash.com/premium_photo-1673210886161-bfcc40f54d1f?ixlib=rb-4.0.3&ixid=MnwxMjA3fDB8MHxzZWFyY2h8MXx8cGVyc29uJTIwc3RhbmRpbmd8ZW58MHx8MHx8&w=1000&q=80"
image = Image.open(requests.get(url, stream=True).raw)
inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)
logits = outputs.logits.cpu()
upsampled_logits = nn.functional.interpolate(
logits,
size=image.size[::-1],
mode="bilinear",
align_corners=False,
)
pred_seg = upsampled_logits.argmax(dim=1)[0]
plt.imshow(pred_seg)
ラベル: 0: "背景", 1: "帽子", 2: "髪", 3: "サングラス", 4: "上着", 5: "スカート", 6: "ズボン", 7: "ドレス", 8: "ベルト", 9: "左靴", 10: "右靴", 11: "顔", 12: "左足", 13: "右足", 14: "左腕", 15: "右腕", 16: "バッグ", 17: "スカーフ"
評価
ラベルインデックス |
ラベル名 |
カテゴリ精度 |
カテゴリIoU |
0 |
背景 |
0.99 |
0.99 |
1 |
帽子 |
0.73 |
0.68 |
2 |
髪 |
0.91 |
0.82 |
3 |
サングラス |
0.73 |
0.63 |
4 |
上着 |
0.87 |
0.78 |
5 |
スカート |
0.76 |
0.65 |
6 |
ズボン |
0.90 |
0.84 |
7 |
ドレス |
0.74 |
0.55 |
8 |
ベルト |
0.35 |
0.30 |
9 |
左靴 |
0.74 |
0.58 |
10 |
右靴 |
0.75 |
0.60 |
11 |
顔 |
0.92 |
0.85 |
12 |
左足 |
0.90 |
0.82 |
13 |
右足 |
0.90 |
0.81 |
14 |
左腕 |
0.86 |
0.74 |
15 |
右腕 |
0.82 |
0.73 |
16 |
バッグ |
0.91 |
0.84 |
17 |
スカーフ |
0.63 |
0.29 |
全体的な評価指標:
- 評価損失: 0.15
- 平均精度: 0.80
- 平均IoU: 0.69
📄 ライセンス
このモデルのライセンスについては、こちらを参照してください。
📚 ドキュメント
BibTeXエントリと引用情報
@article{DBLP:journals/corr/abs-2105-15203,
author = {Enze Xie and
Wenhai Wang and
Zhiding Yu and
Anima Anandkumar and
Jose M. Alvarez and
Ping Luo},
title = {SegFormer: Simple and Efficient Design for Semantic Segmentation with
Transformers},
journal = {CoRR},
volume = {abs/2105.15203},
year = {2021},
url = {https://arxiv.org/abs/2105.15203},
eprinttype = {arXiv},
eprint = {2105.15203},
timestamp = {Wed, 02 Jun 2021 11:46:42 +0200},
biburl = {https://dblp.org/rec/journals/corr/abs-2105-15203.bib},
bibsource = {dblp computer science bibliography, https://dblp.org}
}