🚀 SPIDER-Thorax模型
SPIDER-thorax模型是一个用于图像分类的深度学习模型,专门针对胸部的切片级病理分类进行训练。它是SPIDER数据集计划的一部分,该计划提供了一个大型、高质量、多器官的病理数据集,并带有专家标注的标签。
🚀 快速开始
模型适用于 1120×1120 的切片。使用以下代码片段来加载和使用模型:
from transformers import AutoModel, AutoProcessor
from PIL import Image
model = AutoModel.from_pretrained("histai/SPIDER-thorax-model", trust_remote_code=True)
processor = AutoProcessor.from_pretrained("histai/SPIDER-thorax-model", trust_remote_code=True)
image = Image.open("path_to_image.png")
inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)
print(outputs.predicted_class_names)
✨ 主要特性
- 专为胸部切片级病理分类设计。
- 基于SPIDER数据集进行训练,数据质量高且有专家标注。
📦 安装指南
文档未提及具体安装步骤,可参考 transformers
库的安装方式。
📚 详细文档
模型描述
SPIDER-thorax模型是一个用于切片级病理分类的深度学习模型,特别针对胸部。它是SPIDER数据集计划的一部分,该计划提供了一个大型、高质量、多器官的病理数据集,并带有专家标注的标签。
如果您想支持、赞助或获取SPIDER数据和模型的商业许可,请通过 models@hist.ai 与我们联系。
模型来源
训练数据
该模型在 SPIDER-thorax 数据集上进行训练,这是SPIDER数据集的一个子集。该数据集包含:
类别 |
中心切片数量 |
肺泡 |
6652 |
支气管软骨 |
5685 |
支气管腺体 |
4412 |
慢性炎症 + 纤维化 |
6070 |
碎屑 |
5146 |
纤维化 |
6494 |
出血 |
5247 |
淋巴结 |
6088 |
色素 |
5177 |
胸膜 |
4560 |
非小细胞肿瘤 |
6445 |
小细胞肿瘤 |
5061 |
软组织肿瘤 |
5894 |
血管 |
5376 |
总数统计:
- 78,307 个中心切片
- 599,459 个总切片(包括上下文切片)
- 411 个用于标注的总切片
结果
器官 |
准确率 |
精确率 |
F1分数 |
胸部 |
0.962 |
0.958 |
0.960 |
📄 许可证
该模型遵循 CC BY-NC 4.0 许可协议,仅用于 研究用途。
🔗 引用
如果您使用此模型,请引用以下内容:
@misc{nechaev2025spidercomprehensivemultiorgansupervised,
title={SPIDER: A Comprehensive Multi-Organ Supervised Pathology Dataset and Baseline Models},
author={Dmitry Nechaev and Alexey Pchelnikov and Ekaterina Ivanova},
year={2025},
eprint={2503.02876},
archivePrefix={arXiv},
primaryClass={eess.IV},
url={https://arxiv.org/abs/2503.02876},
}
ℹ️ 更多信息
要探索其他模型和SPIDER数据集,您可以访问项目的 Hugging Face HistAI页面 或 GitHub仓库。
📞 联系方式
- 作者:Dmitry Nechaev, Alexey Pchelnikov, Ekaterina Ivanova
- 邮箱:dmitry@hist.ai, alex@hist.ai, kate@hist.ai