🚀 MaskFormer
MaskFormerは、COCOパノプティックセグメンテーションデータセットで訓練されたモデル(Swinバックボーンを使用したミニバージョン)です。このモデルは、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションなどのタスクを解決し、画像セグメンテーション分野に新しい解決策をもたらします。
🚀 クイックスタート
このモデルをセマンティックセグメンテーションに使用するには、以下のコード例を使用できます。
from transformers import MaskFormerFeatureExtractor, MaskFormerForInstanceSegmentation
from PIL import Image
import requests
feature_extractor = MaskFormerFeatureExtractor.from_pretrained("facebook/maskformer-swin-tiny-coco")
model = MaskFormerForInstanceSegmentation.from_pretrained("facebook/maskformer-swin-tiny-coco")
url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
class_queries_logits = outputs.class_queries_logits
masks_queries_logits = outputs.masks_queries_logits
result = feature_extractor.post_process_panoptic_segmentation(outputs, target_sizes=[image.size[::-1]])[0]
predicted_panoptic_map = result["segmentation"]
より多くのコード例については、ドキュメントを参照してください。
✨ 主な機能
MaskFormerは、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションを同じパラダイムで処理します。具体的には、一連のマスクと対応するラベルを予測することで、これら3つのタスクをすべてインスタンスセグメンテーションタスクとして扱います。

📚 ドキュメント
想定用途と制限
この特定のチェックポイントをセマンティックセグメンテーションに使用できます。モデルセンターを参照して、あなたが興味を持つタスクに合わせて微調整された他のバージョンを探してください。
使用方法
このモデルの使用方法を以下に示します。
from transformers import MaskFormerFeatureExtractor, MaskFormerForInstanceSegmentation
from PIL import Image
import requests
feature_extractor = MaskFormerFeatureExtractor.from_pretrained("facebook/maskformer-swin-tiny-coco")
model = MaskFormerForInstanceSegmentation.from_pretrained("facebook/maskformer-swin-tiny-coco")
url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
class_queries_logits = outputs.class_queries_logits
masks_queries_logits = outputs.masks_queries_logits
result = feature_extractor.post_process_panoptic_segmentation(outputs, target_sizes=[image.size[::-1]])[0]
predicted_panoptic_map = result["segmentation"]
📄 ライセンス
ライセンスの種類:other