🚀 植被分類模型
這是一個基於Transformer架構的圖像分類模型,採用遷移學習技術實現,可有效對植被圖像進行分類,為相關領域提供準確的圖像識別支持。
🚀 快速開始
你可以藉助Hugging Face的Transformers庫中的pipeline
類直接使用該模型,或者將目標圖像上傳到託管推理API。
>>>from transformers import pipeline
>>>classifier = pipeline("image-classification", model="iammartian0/vegetation_classification_model")
>>>classifier(image)
✨ 主要特性
- 基於Transformer架構,利用遷移學習技術,提升模型性能。
- 預訓練模型採用在Imagenet - 21k上訓練的Vision transformer。
- 模型在特定數據集上微調後,Top - 1準確率達到0.929。
📦 安裝指南
文檔未提及具體安裝步驟,暫不展示。
💻 使用示例
基礎用法
>>>from transformers import pipeline
>>>classifier = pipeline("image-classification", model="iammartian0/vegetation_classification_model")
>>>classifier(image)
高級用法
將目標圖像上傳到託管推理API進行使用。
📚 詳細文檔
模型描述
這是一個基於Transformers的圖像分類模型,採用遷移學習技術實現。預訓練模型是在Imagenet - 21k上訓練的Vision transformer。
數據集
使用的數據集從Git倉庫Agri - Hub/Space2Ground下載。本模型使用了街道級圖像補丁文件夾,該數據集包含從Mapillary街道級圖像中裁剪出的植被部分。更多詳細信息可查看鏈接的Git倉庫。
訓練過程
預處理
根據父文件夾名稱分配標籤。
圖像變換
對所有訓練圖像應用torchvision.transforms
中的RandomResizedCrop
。
微調
模型在數據集上進行了四個epoch的微調。
評估結果
模型的Top - 1準確率達到了0.929。
進一步探索方向
- 訓練一個多標籤模型,除了對植被進行分類外,還能判斷圖像是來自左側還是右側。
- 使用原始/初始的街道級圖像集對作物標籤進行細粒度分類。
🔧 技術細節
本模型基於遷移學習技術,利用預訓練的Vision Transformer模型在特定數據集上進行微調。在訓練過程中,通過對圖像進行預處理和變換,以及多輪的微調訓練,使得模型在植被分類任務上達到了較高的準確率。
📄 許可證
本項目採用Apache - 2.0許可證。
BibTeX引用信息
@misc{wu2020visual,
title={Visual Transformers: Token-based Image Representation and Processing for Computer Vision},
author={Bichen Wu and Chenfeng Xu and Xiaoliang Dai and Alvin Wan and Peizhao Zhang and Zhicheng Yan and Masayoshi Tomizuka and Joseph Gonzalez and Kurt Keutzer and Peter Vajda},
year={2020},
eprint={2006.03677},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
@INPROCEEDINGS{9816335,
author={Choumos, George and Koukos, Alkiviadis and Sitokonstantinou, Vasileios and Kontoes, Charalampos},
booktitle={2022 IEEE 14th Image, Video, and Multidimensional Signal Processing Workshop (IVMSP)},
title={Towards Space-to-Ground Data Availability for Agriculture Monitoring},
year={2022},
volume={},
number={},
pages={1-5},
doi={10.1109/IVMSP54334.2022.9816335}
}