🚀 症狀到診斷模型
本模型是一個用於從症狀描述診斷疾病的文本分類模型,基於預訓練模型進行微調,能根據自然語言描述的症狀預測22種對應的診斷結果。
🚀 快速開始
使用以下代碼示例,通過transformers
庫的pipeline
快速調用模型進行文本分類:
from transformers import pipeline
pipe = pipeline("text-classification", model="Zabihin/Symptom_to_Diagnosis")
result = pipe("I've been having headaches and migraines, and I can't sleep. My whole body shakes and twitches. Sometimes I feel lightheaded.")
print(result)
或者使用以下代碼:
from transformers import pipeline
classifier = pipeline("text-classification", model="Zabihin/Symptom_to_Diagnosis", tokenizer="Zabihin/Symptom_to_Diagnosis")
input_text = "I've been having headaches and migraines, and I can't sleep. My whole body shakes and twitches. Sometimes I feel lightheaded."
result = classifier(input_text)
predicted_label = result[0]['label']
print("Predicted Label:", predicted_label)
✨ 主要特性
- 微調模型:基於 bert-base-cased 進行微調,適用於從症狀診斷疾病的文本分類任務。
- 精準預測:旨在分析症狀的自然語言描述,並預測22種對應的診斷結果之一。
📦 安裝指南
使用此模型前,請確保安裝了以下版本的庫:
屬性 |
詳情 |
模型類型 |
基於 bert-base-cased 微調的文本分類模型 |
訓練數據 |
Gretel/symptom_to_diagnosis 數據集 |
Transformers 版本 |
4.35.2 |
TensorFlow 版本 |
2.15.0 |
Datasets 版本 |
2.15.0 |
Tokenizers 版本 |
0.15.0 |
📚 詳細文檔
模型描述
本模型是 bert-base-cased 架構的微調版本,專為從症狀診斷疾病的文本分類任務而設計。主要目標是分析症狀的自然語言描述,並預測22種對應的診斷結果之一。
數據集信息
模型在 Gretel/symptom_to_diagnosis 數據集上進行訓練,該數據集包含1065條英文症狀描述,每條描述都標註了22種可能診斷結果中的一種。數據集側重於細粒度的單領域診斷,適用於需要根據症狀描述進行詳細分類的任務。
示例:
{
"output_text": "drug reaction",
"input_text": "I've been having headaches and migraines, and I can't sleep. My whole body shakes and twitches. Sometimes I feel lightheaded."
}
模型評估結果
任務類型 |
數據集 |
評估指標 |
值 |
文本分類 |
gretelai/symptom_to_diagnosis (測試集) |
精確率 (macro avg) |
0.94 |
文本分類 |
gretelai/symptom_to_diagnosis (測試集) |
召回率 (macro avg) |
0.93 |
文本分類 |
gretelai/symptom_to_diagnosis (測試集) |
F1 分數 (macro avg) |
0.93 |
📄 許可證
本模型使用 Apache-2.0 許可證。