Roofsense
RoofSense是一個用於多模態屋頂材料分類的編碼器-解碼器語義分割模型,結合了ResNet-18-D與DeepLabv3+架構。
下載量 26
發布時間 : 4/25/2025
模型概述
該模型採用編碼器-解碼器架構,專門用於航拍影像和激光雷達數據的屋頂材料分類任務,通過語義分割技術實現高精度識別。
模型特點
多模態數據融合
支持航拍影像和激光雷達數據的融合處理,提升屋頂材料分類的準確性。
改進的編碼器架構
編碼器模塊增加了抗鋸齒和高效通道注意力機制,優化了特徵提取能力。
優化的解碼器設計
解碼器的空洞空間金字塔池化模塊採用特定空洞率設置,輸出步長為16,提升小區域預測效果。
模型能力
航拍影像分析
激光雷達數據處理
屋頂材料分類
語義分割
使用案例
建築與城市規劃
屋頂材料識別
用於識別和分類建築物屋頂材料,支持建築維護和城市規劃。
平均準確率84.99%,整體準確率91.13%
遙感分析
航拍影像分割
對航拍影像進行語義分割,識別不同屋頂材料區域。
mIoU達到74.74%
精選推薦AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多語言圖像描述任務。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根據文本提示生成高質量圖像。該模型在優化推理效率的同時,將性能損失降至最低。
圖像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
這是一個基於Qwen2.5-VL-7B模型的靜態量化版本,專注於圖像描述生成任務,支持多種語言。
圖像生成文本
Transformers 支持多種語言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基於Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225數據集微調後量化為FP8版本的文檔OCR模型。
圖像生成文本
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基於Qwen3-1.7B開發的專注於代理式網絡搜索和輕量級瀏覽的模型,在移動設備上也能高效運行。
大型語言模型
Transformers 英語

L
Mungert
263
2