🚀 CSP-Darknet-53 Mish模型
CSP-Darknet-53 Mish模型在ImageNette数据集上进行了预训练。CSP-Darknet-53 Mish架构在这篇论文中被提出。该模型可用于图像分类任务,借助独特架构和激活函数替换提升性能。
🚀 快速开始
本模型可用于图像分类任务,借助独特架构和激活函数替换提升性能。你可以按照以下步骤使用该模型:
- 安装依赖
- 加载模型
- 准备输入图像
- 进行推理
✨ 主要特性
- 架构创新:作者的核心思想是在架构中添加跨阶段部分块(cross stage partial blocks)来改变卷积阶段,并将激活函数替换为Mish。
- 预训练模型:在ImageNette数据集上进行了预训练。
📦 安装指南
前提条件
安装Holocron需要Python 3.6(或更高版本)以及pip/conda。
最新稳定版本
你可以使用pypi安装该包的最新稳定版本,命令如下:
pip install pylocron
或者使用conda安装:
conda install -c frgfm pylocron
开发模式
如果你希望使用该项目尚未发布的最新功能,可以从源代码安装该包(请先安装Git):
git clone https://github.com/frgfm/Holocron.git
pip install -e Holocron/.
💻 使用示例
基础用法
from PIL import Image
from torchvision.transforms import Compose, ConvertImageDtype, Normalize, PILToTensor, Resize
from torchvision.transforms.functional import InterpolationMode
from holocron.models import model_from_hf_hub
model = model_from_hf_hub("frgfm/cspdarknet53_mish").eval()
img = Image.open(path_to_an_image).convert("RGB")
config = model.default_cfg
transform = Compose([
Resize(config['input_shape'][1:], interpolation=InterpolationMode.BILINEAR),
PILToTensor(),
ConvertImageDtype(torch.float32),
Normalize(config['mean'], config['std'])
])
input_tensor = transform(img).unsqueeze(0)
with torch.inference_mode():
output = model(input_tensor)
probs = output.squeeze(0).softmax(dim=0)
📚 详细文档
模型描述
作者的核心思想是在架构中添加跨阶段部分块来改变卷积阶段,并将激活函数替换为Mish。
数据集
该模型在ImageNette数据集上进行了预训练。
引用
原论文
@article{DBLP:journals/corr/abs-1911-11929,
author = {Chien{-}Yao Wang and
Hong{-}Yuan Mark Liao and
I{-}Hau Yeh and
Yueh{-}Hua Wu and
Ping{-}Yang Chen and
Jun{-}Wei Hsieh},
title = {CSPNet: {A} New Backbone that can Enhance Learning Capability of {CNN}},
journal = {CoRR},
volume = {abs/1911.11929},
year = {2019},
url = {http://arxiv.org/abs/1911.11929},
eprinttype = {arXiv},
eprint = {1911.11929},
timestamp = {Tue, 03 Dec 2019 20:41:07 +0100},
biburl = {https://dblp.org/rec/journals/corr/abs-1911-11929.bib},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
本实现的来源
@software{Fernandez_Holocron_2020,
author = {Fernandez, François-Guillaume},
month = {5},
title = {{Holocron}},
url = {https://github.com/frgfm/Holocron},
year = {2020}
}
📄 许可证
本项目采用Apache-2.0许可证。