🚀 症状到诊断模型
本模型是一个用于从症状描述诊断疾病的文本分类模型,基于预训练模型进行微调,能根据自然语言描述的症状预测22种对应的诊断结果。
🚀 快速开始
使用以下代码示例,通过transformers
库的pipeline
快速调用模型进行文本分类:
from transformers import pipeline
pipe = pipeline("text-classification", model="Zabihin/Symptom_to_Diagnosis")
result = pipe("I've been having headaches and migraines, and I can't sleep. My whole body shakes and twitches. Sometimes I feel lightheaded.")
print(result)
或者使用以下代码:
from transformers import pipeline
classifier = pipeline("text-classification", model="Zabihin/Symptom_to_Diagnosis", tokenizer="Zabihin/Symptom_to_Diagnosis")
input_text = "I've been having headaches and migraines, and I can't sleep. My whole body shakes and twitches. Sometimes I feel lightheaded."
result = classifier(input_text)
predicted_label = result[0]['label']
print("Predicted Label:", predicted_label)
✨ 主要特性
- 微调模型:基于 bert-base-cased 进行微调,适用于从症状诊断疾病的文本分类任务。
- 精准预测:旨在分析症状的自然语言描述,并预测22种对应的诊断结果之一。
📦 安装指南
使用此模型前,请确保安装了以下版本的库:
属性 |
详情 |
模型类型 |
基于 bert-base-cased 微调的文本分类模型 |
训练数据 |
Gretel/symptom_to_diagnosis 数据集 |
Transformers 版本 |
4.35.2 |
TensorFlow 版本 |
2.15.0 |
Datasets 版本 |
2.15.0 |
Tokenizers 版本 |
0.15.0 |
📚 详细文档
模型描述
本模型是 bert-base-cased 架构的微调版本,专为从症状诊断疾病的文本分类任务而设计。主要目标是分析症状的自然语言描述,并预测22种对应的诊断结果之一。
数据集信息
模型在 Gretel/symptom_to_diagnosis 数据集上进行训练,该数据集包含1065条英文症状描述,每条描述都标注了22种可能诊断结果中的一种。数据集侧重于细粒度的单领域诊断,适用于需要根据症状描述进行详细分类的任务。
示例:
{
"output_text": "drug reaction",
"input_text": "I've been having headaches and migraines, and I can't sleep. My whole body shakes and twitches. Sometimes I feel lightheaded."
}
模型评估结果
任务类型 |
数据集 |
评估指标 |
值 |
文本分类 |
gretelai/symptom_to_diagnosis (测试集) |
精确率 (macro avg) |
0.94 |
文本分类 |
gretelai/symptom_to_diagnosis (测试集) |
召回率 (macro avg) |
0.93 |
文本分类 |
gretelai/symptom_to_diagnosis (测试集) |
F1 分数 (macro avg) |
0.93 |
📄 许可证
本模型使用 Apache-2.0 许可证。