Turkish Medical Question Answering
模型简介
该模型是基于dbmdz/bert-base-turkish-cased微调的版本,专为土耳其语医疗领域问答优化,采用BERT架构并添加了Dropout正则化以防止过拟合
模型特点
医疗领域优化
专门针对土耳其语医疗文本进行微调,能更好理解医学术语和上下文
正则化处理
添加了隐藏层和注意力层的Dropout正则化(概率0.2),有效防止过拟合
高性能指标
在医疗问答任务上达到76.14的F1分数和52.79的精确匹配率
模型能力
土耳其语医疗文本理解
抽取式问答
医疗术语识别
使用案例
医疗信息检索
临床指南查询
从医疗文档中快速查找特定诊疗方案或检查建议
能准确提取如'侧位X光片在判断后方骨折稳定性和移位程度时必要'等专业信息
医学教育辅助
帮助医学生从教材或研究论文中定位特定知识点
可精确回答如'大转子远端需要显示多少厘米范围'等细节问题(回答'10cm')
🚀 土耳其语医学问答模型
本模型专为土耳其语医学领域的问答任务而设计,基于预训练模型微调优化,能够从医学文本中精准提取答案,为医学专业人士和研究人员提供有力的信息支持。
🚀 快速开始
环境准备
确保你已经安装了 transformers
库。如果尚未安装,可以使用以下命令进行安装:
pip install transformers
代码示例
# 使用pipeline作为高级辅助工具
from transformers import pipeline
pipe = pipeline("question-answering", model="kaixkhazaki/turkish-question-answering")
# 示例
## 定义上下文
context = """
Kalça kırığından şüphe duyulan hastalarda öncelikle standart grafiler çekilmelidir. Bunlar ön arka pelvis grafisi ve etkilenen kalçanın ön arka ve yan grafileridir.
Özellikle deplase olmayan kırıklarda sağlam taraf ile patolojik tarafın mukayese edilmesi önemlidir. Kırık kalçanın filmi, alt ekstremite hafif traksiyonda iken nötral pozisyonda,
patella ışın düzlemine dikey halde çekilir. Trokanter majörün en az 10 cm distaline kadar görülmesi faydalı olacaktır. Ayrıca sağlam tarafın görülmesi ile osteoporoz ve hastanın
normal boyun-cisim açısının tayininde önemlidir. Lateral radyografi posteriorda kırığın stabilitesini ve deplasman miktarını belirlemek için gereklidir. Lateral grafi çekimi acil
olmamakla birlikte kırığın daha doğru değerlendirilmesi açısından önemlidir. Eğer hasta grafi masasında iken çekilemiyor ise, traksiyon masasına alındığında görülebilir.
Nadiren de olsa tanı için tomografi çekilmesi gerekli olabilir. Bunun yanında kalça kırığı şüphesi yüksek olan, ancak direk grafide kırık tanısı konulamayan hastalara MR çekilerek
tanı rahatlıkla konulabilir. Yine röntgende görünmeyen ancak kırık şüphesi yüksek olan hastalara 48-72 saat içerisinde yapılan sintigrafilerde duyarlılık % 100'dür.
"""
# 定义问题
question = "Lateral radyografi hangi durumlar için gereklidir?"
print(pipe(question=question, context=context))
✨ 主要特性
- 领域适配:针对土耳其语医学领域的问答任务进行了微调优化,能够更好地处理医学专业文本。
- 精准提取:采用BERT架构,并添加了额外的Dropout正则化,有效防止过拟合,能够准确地从医学文本中提取答案。
- 指标优异:在测试评估集上取得了良好的成绩,包括较低的损失值、较高的精确匹配率和F1分数。
📦 安装指南
依赖安装
使用以下命令安装所需的依赖库:
pip install transformers datasets torch tokenizers
模型加载
在代码中使用 transformers
库加载模型:
from transformers import pipeline
pipe = pipeline("question-answering", model="kaixkhazaki/turkish-question-answering")
💻 使用示例
基础用法
# 使用pipeline作为高级辅助工具
from transformers import pipeline
pipe = pipeline("question-answering", model="kaixkhazaki/turkish-question-answering")
# 示例
## 定义上下文
context = """
Kalça kırığından şüphe duyulan hastalarda öncelikle standart grafiler çekilmelidir. Bunlar ön arka pelvis grafisi ve etkilenen kalçanın ön arka ve yan grafileridir.
Özellikle deplase olmayan kırıklarda sağlam taraf ile patolojik tarafın mukayese edilmesi önemlidir. Kırık kalçanın filmi, alt ekstremite hafif traksiyonda iken nötral pozisyonda,
patella ışın düzlemine dikey halde çekilir. Trokanter majörün en az 10 cm distaline kadar görülmesi faydalı olacaktır. Ayrıca sağlam tarafın görülmesi ile osteoporoz ve hastanın
normal boyun-cisim açısının tayininde önemlidir. Lateral radyografi posteriorda kırığın stabilitesini ve deplasman miktarını belirlemek için gereklidir. Lateral grafi çekimi acil
olmamakla birlikte kırığın daha doğru değerlendirilmesi açısından önemlidir. Eğer hasta grafi masasında iken çekilemiyor ise, traksiyon masasına alındığında görülebilir.
Nadiren de olsa tanı için tomografi çekilmesi gerekli olabilir. Bunun yanında kalça kırığı şüphesi yüksek olan, ancak direk grafide kırık tanısı konulamayan hastalara MR çekilerek
tanı rahatlıkla konulabilir. Yine röntgende görünmeyen ancak kırık şüphesi yüksek olan hastalara 48-72 saat içerisinde yapılan sintigrafilerde duyarlılık % 100'dür.
"""
# 定义问题
question = "Lateral radyografi hangi durumlar için gereklidir?"
print(pipe(question=question, context=context))
高级用法
# 可以多次调用pipeline处理不同的问题和上下文
# 示例
## 定义上下文
context = """
Kalça kırığından şüphe duyulan hastalarda öncelikle standart grafiler çekilmelidir. Bunlar ön arka pelvis grafisi ve etkilenen kalçanın ön arka ve yan grafileridir.
Özellikle deplase olmayan kırıklarda sağlam taraf ile patolojik tarafın mukayese edilmesi önemlidir. Kırık kalçanın filmi, alt ekstremite hafif traksiyonda iken nötral pozisyonda,
patella ışın düzlemine dikey halde çekilir. Trokanter majörün en az 10 cm distaline kadar görülmesi faydalı olacaktır. Ayrıca sağlam tarafın görülmesi ile osteoporoz ve hastanın
normal boyun-cisim açısının tayininde önemlidir. Lateral radyografi posteriorda kırığın stabilitesini ve deplasman miktarını belirlemek için gereklidir. Lateral grafi çekimi acil
olmamakla birlikte kırığın daha doğru değerlendirilmesi açısından önemlidir. Eğer hasta grafi masasında iken çekilemiyor ise, traksiyon masasına alındığında görülebilir.
Nadiren de olsa tanı için tomografi çekilmesi gerekli olabilir. Bunun yanında kalça kırığı şüphesi yüksek olan, ancak direk grafide kırık tanısı konulamayan hastalara MR çekilerek
tanı rahatlıkla konulabilir. Yine röntgende görünmeyen ancak kırık şüphesi yüksek olan hastalara 48-72 saat içerisinde yapılan sintigrafilerde duyarlılık % 100'dür.
"""
# 定义问题
question = "Trokanter majörün kaç cm distaline kadar görülmesi faydalıdır?"
print(pipe(question=question, context=context))
📚 详细文档
预期用途
- 医学问答:为土耳其语医学领域的问题提供答案。
- 信息提取:从土耳其语医学文本中提取相关信息。
- 专业支持:辅助医学专业人士和研究人员在医学文档中查找特定信息。
局限性
- 专业建议替代:本模型不能替代专业的医学建议。
- 数据偏差:模型可能反映医学训练数据中存在的偏差。
- 性能差异:在不同的医学专业和术语上,模型的性能可能会有所不同。
- 复杂问题处理:不适合回答需要推理或综合信息的复杂医学问题。
- 领域适用性:专门为医学领域训练,在通用领域问题上可能表现不佳。
- 术语覆盖:对于训练数据中未出现的高度技术性医学术语,模型的性能可能会受到影响。
- 问答类型:仅限于提取式问答(查找直接存在于文本中的答案)。
🔧 技术细节
训练超参数
参数 | 值 |
---|---|
基础模型 | dbmdz/bert-base-turkish-cased |
批量大小 | 16 |
学习率 | 1e-5 |
训练轮数 | 10 |
权重衰减 | 0.02 |
热身步数 | 1000 |
学习率调度器 | Cosine |
梯度裁剪 | 1.0 |
训练精度 | BF16 |
优化器 | AdamW |
模型架构修改
参数 | 值 |
---|---|
隐藏层Dropout概率 | 0.2 |
注意力概率Dropout | 0.2 |
训练和评估数据
模型在土耳其语医学问答数据集上进行了训练:
@INPROCEEDINGS{10711128,
author={İncidelen, Mert and Aydoğan, Murat},
booktitle={2024 8th International Artificial Intelligence and Data Processing Symposium (IDAP)},
title={Developing Question-Answering Models in Low-Resource Languages: A Case Study on Turkish Medical Texts Using Transformer-Based Approaches},
year={2024},
volume={},
number={},
pages={1-4},
keywords={Training;Adaptation models;Natural languages;Focusing;Encyclopedias;Transformers;Data models;Internet;Online services;Text processing;Natural Language Processing;Medical Domain;BERTurk;Question-Answering},
doi={10.1109/IDAP64064.2024.10711128}}
训练过程
预处理
- 最大序列长度:384
- 步长:128
- 问题和上下文对:使用
BertTokenizerFast
进行分词
评估策略
- 评估频率:每50步进行一次评估
- 最佳模型保存:基于F1分数保存最佳模型
- 评估指标:精确匹配率和F1分数
训练结果
训练损失 | 轮数 | 步数 | 验证损失 | 精确匹配率 | F1分数 |
---|---|---|---|---|---|
5.9507 | 0.1166 | 50 | 5.9381 | 0.0 | 6.0684 |
5.8385 | 0.2331 | 100 | 5.7914 | 0.0 | 6.4166 |
5.6579 | 0.3497 | 150 | 5.5785 | 0.0 | 6.1711 |
5.3863 | 0.4662 | 200 | 5.3045 | 0.2012 | 6.2450 |
5.0968 | 0.5828 | 250 | 4.9885 | 0.5976 | 7.6302 |
4.7795 | 0.6993 | 300 | 4.6415 | 1.0941 | 8.9163 |
4.4223 | 0.8159 | 350 | 4.2947 | 1.6293 | 9.4547 |
4.1392 | 0.9324 | 400 | 3.9772 | 4.6748 | 14.3025 |
3.8572 | 1.0490 | 450 | 3.4575 | 12.5448 | 27.5850 |
3.3154 | 1.1655 | 500 | 2.5605 | 28.7234 | 51.4219 |
2.8303 | 1.2821 | 550 | 2.2085 | 35.0144 | 57.9319 |
2.5985 | 1.3986 | 600 | 2.0545 | 38.8122 | 61.8230 |
2.3931 | 1.5152 | 650 | 1.9646 | 38.8283 | 62.3091 |
2.3749 | 1.6317 | 700 | 1.8911 | 42.2311 | 64.3891 |
2.3268 | 1.7483 | 750 | 1.8363 | 42.9521 | 65.1745 |
2.1324 | 1.8648 | 800 | 1.7683 | 43.2540 | 66.5840 |
2.1652 | 1.9814 | 850 | 1.6980 | 45.5979 | 67.6440 |
1.9279 | 2.0979 | 900 | 1.6432 | 46.4935 | 68.1335 |
1.9351 | 2.2145 | 950 | 1.6031 | 46.7866 | 68.4213 |
1.8488 | 2.3310 | 1000 | 1.5765 | 48.7047 | 70.2017 |
1.8967 | 2.4476 | 1050 | 1.5462 | 47.9791 | 69.8952 |
1.7476 | 2.5641 | 1100 | 1.5040 | 49.2903 | 71.0521 |
1.7635 | 2.6807 | 1150 | 1.5197 | 49.2188 | 70.7629 |
1.7595 | 2.7972 | 1200 | 1.4790 | 49.8724 | 70.5285 |
1.7699 | 2.9138 | 1250 | 1.4283 | 52.5707 | 72.8425 |
1.7792 | 3.0303 | 1300 | 1.4246 | 50.5762 | 72.0336 |
1.5396 | 3.1469 | 1350 | 1.4117 | 52.6248 | 72.8936 |
1.5112 | 3.2634 | 1400 | 1.3938 | 53.1888 | 73.1075 |
1.5936 | 3.3800 | 1450 | 1.3805 | 53.8953 | 73.4629 |
1.4775 | 3.4965 | 1500 | 1.3522 | 53.5443 | 72.8847 |
1.3998 | 3.6131 | 1550 | 1.3730 | 52.9262 | 72.7934 |
1.4743 | 3.7296 | 1600 | 1.3593 | 53.2319 | 73.0427 |
1.572 | 3.8462 | 1650 | 1.3748 | 53.7484 | 73.1917 |
1.5321 | 3.9627 | 1700 | 1.3096 | 54.2929 | 72.9719 |
1.2849 | 4.0793 | 1750 | 1.3057 | 54.1823 | 73.5710 |
1.4073 | 4.1958 | 1800 | 1.2768 | 55.1072 | 73.9657 |
1.2894 | 4.3124 | 1850 | 1.3707 | 54.0984 | 73.5854 |
1.2771 | 4.4289 | 1900 | 1.3068 | 54.9686 | 74.2854 |
1.2683 | 4.5455 | 1950 | 1.2683 | 55.6818 | 74.6788 |
1.3432 | 4.6620 | 2000 | 1.2704 | 55.3866 | 74.1082 |
1.3052 | 4.7786 | 2050 | 1.2826 | 54.5570 | 73.9376 |
1.3458 | 4.8951 | 2100 | 1.2436 | 54.4304 | 74.1391 |
1.1832 | 5.0117 | 2150 | 1.2914 | 55.8081 | 74.5105 |
1.1964 | 5.1282 | 2200 | 1.2332 | 56.8182 | 75.6849 |
1.1179 | 5.2448 | 2250 | 1.2661 | 55.5273 | 74.5969 |
1.1602 | 5.3613 | 2300 | 1.2717 | 56.0203 | 75.5936 |
1.1314 | 5.4779 | 2350 | 1.2784 | 55.5133 | 75.2080 |
1.2153 | 5.5944 | 2400 | 1.2401 | 56.3682 | 75.6323 |
1.1613 | 5.7110 | 2450 | 1.2470 | 55.8081 | 75.5565 |
1.0839 | 5.8275 | 2500 | 1.2555 | 56.2108 | 75.3284 |
1.1208 | 5.9441 | 2550 | 1.2151 | 56.0606 | 75.3103 |
1.1018 | 6.0606 | 2600 | 1.2407 | 56.2814 | 75.4373 |
1.004 | 6.1772 | 2650 | 1.2561 | 56.1869 | 75.1453 |
1.0081 | 6.2937 | 2700 | 1.2708 | 56.3843 | 75.1235 |
1.0503 | 6.4103 | 2750 | 1.2398 | 56.4780 | 75.2607 |
1.1078 | 6.5268 | 2800 | 1.2424 | 56.1558 | 75.4293 |
1.0516 | 6.6434 | 2850 | 1.2425 | 57.0342 | 76.0343 |
1.0919 | 6.7599 | 2900 | 1.2361 | 56.5107 | 75.1984 |
1.0834 | 6.8765 | 2950 | 1.2307 | 56.6158 | 75.4564 |
1.0308 | 6.9930 | 3000 | 1.2331 | 55.9236 | 75.7649 |
0.9756 | 7.1096 | 3050 | 1.2354 | 56.9250 | 76.0355 |
0.9279 | 7.2261 | 3100 | 1.2538 | 56.4168 | 75.7899 |
0.9655 | 7.3427 | 3150 | 1.2458 | 56.4885 | 76.0547 |
0.9776 | 7.4592 | 3200 | 1.2351 | 57.0701 | 76.0798 |
0.925 | 7.5758 | 3250 | 1.2309 | 56.6158 | 75.7755 |
1.0088 | 7.6923 | 3300 | 1.2403 | 56.2897 | 75.7209 |
1.0534 | 7.8089 | 3350 | 1.2426 | 55.1592 | 75.2877 |
1.0021 | 7.9254 | 3400 | 1.2364 | 55.9645 | 75.4818 |
0.9248 | 8.0420 | 3450 | 1.2420 | 55.5838 | 75.7577 |
0.9077 | 8.1585 | 3500 | 1.2389 | 56.0051 | 75.6164 |
0.9882 | 8.2751 | 3550 | 1.2259 | 55.8228 | 75.5104 |
0.9151 | 8.3916 | 3600 | 1.2330 | 56.5272 | 76.1745 |
0.9682 | 8.5082 | 3650 | 1.2406 | 56.6372 | 75.9005 |
1.0271 | 8.6247 | 3700 | 1.2343 | 56.4557 | 75.7307 |
0.9019 | 8.7413 | 3750 | 1.2343 | 56.3291 | 75.8930 |
0.8673 | 8.8578 | 3800 | 1.2379 | 56.2183 | 75.9115 |
0.91 | 8.9744 | 3850 | 1.2421 | 56.0759 | 75.8580 |
0.8888 | 9.0909 | 3900 | 1.2399 | 56.2183 | 76.0760 |
0.874 | 9.2075 | 3950 | 1.2438 | 56.0203 | 75.8630 |
0.9676 | 9.3240 | 4000 | 1.2445 | 56.2738 | 76.0027 |
0.9712 | 9.4406 | 4050 | 1.2413 | 56.1470 | 76.0020 |
0.8792 | 9.5571 | 4100 | 1.2416 | 56.1470 | 75.9679 |
0.9358 | 9.6737 | 4150 | 1.2406 | 56.4005 | 75.9939 |
0.8496 | 9.7902 | 4200 | 1.2411 | 56.4005 | 76.0539 |
0.9618 | 9.9068 | 4250 | 1.2412 | 56.2738 | 76.0405 |
框架版本
- Transformers 4.48.0.dev0
- Pytorch 2.4.1+cu121
- Datasets 3.1.0
- Tokenizers 0.21.0
📄 许可证
本模型采用MIT许可证。
📚 引用
@misc{turkish-medical-question-answering,
author = {Fatih Demirci},
title = {Turkish Medical Question Answering Model},
year = {2024},
publisher = {HuggingFace},
journal = {HuggingFace Model Hub},
howpublished = {\url{https://huggingface.co/kaixkhazaki/turkish-medical-question-answering}}
}
Distilbert Base Cased Distilled Squad
Apache-2.0
DistilBERT是BERT的轻量级蒸馏版本,参数量减少40%,速度提升60%,保留95%以上性能。本模型是在SQuAD v1.1数据集上微调的问答专用版本。
问答系统 英语
D
distilbert
220.76k
244
Distilbert Base Uncased Distilled Squad
Apache-2.0
DistilBERT是BERT的轻量级蒸馏版本,参数量减少40%,速度提升60%,在GLUE基准测试中保持BERT 95%以上的性能。本模型专为问答任务微调。
问答系统
Transformers 英语

D
distilbert
154.39k
115
Tapas Large Finetuned Wtq
Apache-2.0
TAPAS是基于BERT架构的表格问答模型,通过自监督方式在维基百科表格数据上预训练,支持对表格内容进行自然语言问答
问答系统
Transformers 英语

T
google
124.85k
141
T5 Base Question Generator
基于t5-base的问答生成模型,输入答案和上下文,输出相应问题
问答系统
Transformers

T
iarfmoose
122.74k
57
Bert Base Cased Qa Evaluator
基于BERT-base-cased的问答对评估模型,用于判断问题和答案是否语义相关
问答系统
B
iarfmoose
122.54k
9
Tiny Doc Qa Vision Encoder Decoder
MIT
一个基于MIT许可证的文档问答模型,主要用于测试目的。
问答系统
Transformers

T
fxmarty
41.08k
16
Dpr Question Encoder Single Nq Base
DPR(密集段落检索)是用于开放领域问答研究的工具和模型。该模型是基于BERT的问题编码器,使用自然问题(NQ)数据集训练。
问答系统
Transformers 英语

D
facebook
32.90k
30
Mobilebert Uncased Squad V2
MIT
MobileBERT是BERT_LARGE的轻量化版本,在SQuAD2.0数据集上微调而成的问答系统模型。
问答系统
Transformers 英语

M
csarron
29.11k
7
Tapas Base Finetuned Wtq
Apache-2.0
TAPAS是一个基于Transformer的表格问答模型,通过自监督学习在维基百科表格数据上预训练,并在WTQ等数据集上微调。
问答系统
Transformers 英语

T
google
23.03k
217
Dpr Question Encoder Multiset Base
基于BERT的密集段落检索(DPR)问题编码器,用于开放领域问答研究,在多个QA数据集上训练
问答系统
Transformers 英语

D
facebook
17.51k
4
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98