O

Oneformer Ade20k Swin Tiny

shi-labsによって開発
初のマルチタスク汎用画像セグメンテーションフレームワーク。単一モデルでセマンティック/インスタンス/パノラマセグメンテーションタスクをサポート
ダウンロード数 12.96k
リリース時間 : 11/16/2022

モデル概要

Swin Transformerバックボーンネットワークのミニバージョンに基づき、タスクトークンメカニズムにより動的なタスク切り替えを実現し、ADE20kデータセットで訓練

モデル特徴

マルチタスク統一アーキテクチャ
単一モデルでセマンティックセグメンテーション、インスタンスセグメンテーション、パノラマセグメンテーションタスクを同時にサポート
動的なタスク切り替え
タスクトークンメカニズムにより、訓練時のタスク誘導と推論時のタスクの動的切り替えを実現
専用モデルを上回る性能
複数のセグメンテーションタスクで、専用の単一タスクモデルよりも性能が優れている

モデル能力

セマンティックセグメンテーション
インスタンスセグメンテーション
パノラマセグメンテーション
画像シーン解析

使用事例

シーン理解
住宅シーン解析
建築シーンの屋根、窓、ドアなど150種類の要素を識別
サンプル画像で住宅構造の正確なセグメンテーション結果を示す
交通シーン分析
道路シーンの車両、歩行者、交通標識などを検出
サンプル画像で飛行機などの移動物体のインスタンスセグメンテーションを示す
ヒューマン・マシンインタラクション
人物セグメンテーション
人物と背景を正確に分離
サンプル画像で人物の輪郭の細かいセグメンテーション結果を示す
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase