# シーン解析

Upernet Swin Small
MIT
UperNetはセマンティックセグメンテーションのためのフレームワークで、Swin Transformerをバックボーンネットワークとして採用し、ピクセルレベルのセマンティックラベル予測を実現できます。
画像セグメンテーション Transformers 英語
U
openmmlab
1,467
5
Upernet Convnext Large
MIT
UperNetは、ピクセルレベルのセマンティックラベル予測のためのConvNeXt大型バックボーンネットワークを組み合わせたセマンティックセグメンテーションフレームワークです。
画像セグメンテーション Transformers 英語
U
openmmlab
23.09k
0
Upernet Convnext Small
MIT
UperNetはセマンティックセグメンテーションのためのフレームワークで、ConvNeXtをバックボーンネットワークとして採用し、ピクセルレベルのセマンティックラベル予測を実現できます。
画像セグメンテーション Transformers 英語
U
openmmlab
43.31k
31
Smallcap7m
画像の内容をテキスト記述に変換できるモデルで、さまざまな視覚言語タスクに適用可能です。
画像生成テキスト Transformers 英語
S
Yova
977
5
Maskformer Swin Large Ade
その他
ADE20kデータセットでトレーニングされたセマンティックセグメンテーションモデルで、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションタスクを統一フレームワークで処理
画像セグメンテーション Transformers
M
facebook
4,708
57
Dpt Large Ade
Apache-2.0
これはADE20kデータセットでファインチューニングされた密な予測トランスフォーマー(DPT)モデルで、セマンティックセグメンテーションタスクに使用されます。
画像セグメンテーション Transformers
D
Intel
3,497
8
Segformer B5 Finetuned Ade 640 640
その他
SegFormerはTransformerアーキテクチャに基づくセマンティックセグメンテーションモデルで、ADE20kデータセットでファインチューニングされており、画像分割タスクに適しています。
画像セグメンテーション Transformers
S
nvidia
42.32k
39
Segformer B2 Finetuned Ade 512 512
その他
SegFormerはTransformerアーキテクチャに基づくセマンティックセグメンテーションモデルで、ADE20kデータセットでファインチューニングされており、512x512解像度の画像セグメンテーションタスクに適しています。
画像セグメンテーション Transformers
S
nvidia
44.07k
3
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase