🚀 ReXNet-1.0xモデル
このモデルは山火事の二値分類用のデータセットで事前学習されています(近日公開予定)。ReXNetアーキテクチャはこの論文で紹介されました。
✨ 主な機能
著者の核心的なアイデアは、チャネルの冗長性を防ぐカスタマイズされたSqueeze-Excitation層を残差ブロックに追加することです。
📦 インストール
前提条件
PyroVisionをインストールするには、Python 3.6(またはそれ以上)とpip/condaが必要です。
最新の安定版
pypiを使用して、パッケージの最後の安定版を以下のようにインストールできます。
pip install pyrovision
またはcondaを使用してインストールすることもできます。
conda install -c pyronear pyrovision
開発者モード
もしまだリリースされていない最新の機能を使用したい場合は、ソースからパッケージをインストールすることができます(まずGitをインストールしてください)。
git clone https://github.com/pyronear/pyro-vision.git
pip install -e pyro-vision/.
💻 使用例
基本的な使用法
from PIL import Image
from torchvision.transforms import Compose, ConvertImageDtype, Normalize, PILToTensor, Resize
from torchvision.transforms.functional import InterpolationMode
from pyrovision.models import model_from_hf_hub
model = model_from_hf_hub("pyronear/rexnet1_0x").eval()
img = Image.open(path_to_an_image).convert("RGB")
config = model.default_cfg
transform = Compose([
Resize(config['input_shape'][1:], interpolation=InterpolationMode.BILINEAR),
PILToTensor(),
ConvertImageDtype(torch.float32),
Normalize(config['mean'], config['std'])
])
input_tensor = transform(img).unsqueeze(0)
with torch.inference_mode():
output = model(input_tensor)
probs = output.squeeze(0).softmax(dim=0)
📚 ドキュメント
引用
元の論文
@article{DBLP:journals/corr/abs-2007-00992,
author = {Dongyoon Han and
Sangdoo Yun and
Byeongho Heo and
Young Joon Yoo},
title = {ReXNet: Diminishing Representational Bottleneck on Convolutional Neural
Network},
journal = {CoRR},
volume = {abs/2007.00992},
year = {2020},
url = {https://arxiv.org/abs/2007.00992},
eprinttype = {arXiv},
eprint = {2007.00992},
timestamp = {Mon, 06 Jul 2020 15:26:01 +0200},
biburl = {https://dblp.org/rec/journals/corr/abs-2007-00992.bib},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
この実装のソース
@software{Fernandez_Holocron_2020,
author = {Fernandez, François-Guillaume},
month = {5},
title = {{Holocron}},
url = {https://github.com/frgfm/Holocron},
year = {2020}
}
📄 ライセンス
このプロジェクトはApache-2.0ライセンスの下で公開されています。