🚀 CSP-Darknet-53 Mish模型
CSP-Darknet-53 Mish模型在ImageNette數據集上進行了預訓練。CSP-Darknet-53 Mish架構在這篇論文中被提出。該模型可用於圖像分類任務,藉助獨特架構和激活函數替換提升性能。
🚀 快速開始
本模型可用於圖像分類任務,藉助獨特架構和激活函數替換提升性能。你可以按照以下步驟使用該模型:
- 安裝依賴
- 加載模型
- 準備輸入圖像
- 進行推理
✨ 主要特性
- 架構創新:作者的核心思想是在架構中添加跨階段部分塊(cross stage partial blocks)來改變卷積階段,並將激活函數替換為Mish。
- 預訓練模型:在ImageNette數據集上進行了預訓練。
📦 安裝指南
前提條件
安裝Holocron需要Python 3.6(或更高版本)以及pip/conda。
最新穩定版本
你可以使用pypi安裝該包的最新穩定版本,命令如下:
pip install pylocron
或者使用conda安裝:
conda install -c frgfm pylocron
開發模式
如果你希望使用該項目尚未發佈的最新功能,可以從源代碼安裝該包(請先安裝Git):
git clone https://github.com/frgfm/Holocron.git
pip install -e Holocron/.
💻 使用示例
基礎用法
from PIL import Image
from torchvision.transforms import Compose, ConvertImageDtype, Normalize, PILToTensor, Resize
from torchvision.transforms.functional import InterpolationMode
from holocron.models import model_from_hf_hub
model = model_from_hf_hub("frgfm/cspdarknet53_mish").eval()
img = Image.open(path_to_an_image).convert("RGB")
config = model.default_cfg
transform = Compose([
Resize(config['input_shape'][1:], interpolation=InterpolationMode.BILINEAR),
PILToTensor(),
ConvertImageDtype(torch.float32),
Normalize(config['mean'], config['std'])
])
input_tensor = transform(img).unsqueeze(0)
with torch.inference_mode():
output = model(input_tensor)
probs = output.squeeze(0).softmax(dim=0)
📚 詳細文檔
模型描述
作者的核心思想是在架構中添加跨階段部分塊來改變卷積階段,並將激活函數替換為Mish。
數據集
該模型在ImageNette數據集上進行了預訓練。
引用
原論文
@article{DBLP:journals/corr/abs-1911-11929,
author = {Chien{-}Yao Wang and
Hong{-}Yuan Mark Liao and
I{-}Hau Yeh and
Yueh{-}Hua Wu and
Ping{-}Yang Chen and
Jun{-}Wei Hsieh},
title = {CSPNet: {A} New Backbone that can Enhance Learning Capability of {CNN}},
journal = {CoRR},
volume = {abs/1911.11929},
year = {2019},
url = {http://arxiv.org/abs/1911.11929},
eprinttype = {arXiv},
eprint = {1911.11929},
timestamp = {Tue, 03 Dec 2019 20:41:07 +0100},
biburl = {https://dblp.org/rec/journals/corr/abs-1911-11929.bib},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
本實現的來源
@software{Fernandez_Holocron_2020,
author = {Fernandez, François-Guillaume},
month = {5},
title = {{Holocron}},
url = {https://github.com/frgfm/Holocron},
year = {2020}
}
📄 許可證
本項目採用Apache-2.0許可證。