D

Dpt Large Ade

Intelによって開発
これはADE20kデータセットでファインチューニングされた密な予測トランスフォーマー(DPT)モデルで、セマンティックセグメンテーションタスクに使用されます。
ダウンロード数 3,497
リリース時間 : 3/2/2022

モデル概要

このモデルは、ビジョントランスフォーマー(ViT)をバックボーンネットワークとして使用し、セマンティックセグメンテーションのためのネック構造とヘッド構造を追加しており、入力画像に対して高品質なセマンティックセグメンテーションを実行できます。

モデル特徴

高性能セマンティックセグメンテーション
ADE20Kデータセットで49.02%のmIoUを達成し、新しい最先端レベルを創出しました。
ビジョントランスフォーマーに基づく
ビジョントランスフォーマー(ViT)をバックボーンネットワークとして使用し、密な予測トランスフォーマー(DPT)アーキテクチャと組み合わせて、高品質なセグメンテーション結果を提供します。
ファインチューニング可能
このアーキテクチャは、より小さなデータセットでファインチューニングでき、これらのデータセットでも新しい最先端レベルを達成しました。

モデル能力

画像セマンティックセグメンテーション
高解像度画像処理
マルチクラス物体認識

使用事例

コンピュータビジョン
シーン解析
複雑なシーン内のさまざまな物体や背景を解析するために使用され、自動運転、ロボットナビゲーションなどのアプリケーションに適しています。
ADE20Kデータセットで49.02%のmIoUを達成。
画像編集
画像編集ツールで使用でき、ユーザーが画像内の異なる要素を迅速に分離するのに役立ちます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase