Turkish Medical Question Answering
模型概述
該模型是基於dbmdz/bert-base-turkish-cased微調的版本,專為土耳其語醫療領域問答優化,採用BERT架構並添加了Dropout正則化以防止過擬合
模型特點
醫療領域優化
專門針對土耳其語醫療文本進行微調,能更好理解醫學術語和上下文
正則化處理
添加了隱藏層和注意力層的Dropout正則化(概率0.2),有效防止過擬合
高性能指標
在醫療問答任務上達到76.14的F1分數和52.79的精確匹配率
模型能力
土耳其語醫療文本理解
抽取式問答
醫療術語識別
使用案例
醫療信息檢索
臨床指南查詢
從醫療文檔中快速查找特定診療方案或檢查建議
能準確提取如'側位X光片在判斷後方骨折穩定性和移位程度時必要'等專業信息
醫學教育輔助
幫助醫學生從教材或研究論文中定位特定知識點
可精確回答如'大轉子遠端需要顯示多少釐米範圍'等細節問題(回答'10cm')
🚀 土耳其語醫學問答模型
本模型專為土耳其語醫學領域的問答任務而設計,基於預訓練模型微調優化,能夠從醫學文本中精準提取答案,為醫學專業人士和研究人員提供有力的信息支持。
🚀 快速開始
環境準備
確保你已經安裝了 transformers
庫。如果尚未安裝,可以使用以下命令進行安裝:
pip install transformers
代碼示例
# 使用pipeline作為高級輔助工具
from transformers import pipeline
pipe = pipeline("question-answering", model="kaixkhazaki/turkish-question-answering")
# 示例
## 定義上下文
context = """
Kalça kırığından şüphe duyulan hastalarda öncelikle standart grafiler çekilmelidir. Bunlar ön arka pelvis grafisi ve etkilenen kalçanın ön arka ve yan grafileridir.
Özellikle deplase olmayan kırıklarda sağlam taraf ile patolojik tarafın mukayese edilmesi önemlidir. Kırık kalçanın filmi, alt ekstremite hafif traksiyonda iken nötral pozisyonda,
patella ışın düzlemine dikey halde çekilir. Trokanter majörün en az 10 cm distaline kadar görülmesi faydalı olacaktır. Ayrıca sağlam tarafın görülmesi ile osteoporoz ve hastanın
normal boyun-cisim açısının tayininde önemlidir. Lateral radyografi posteriorda kırığın stabilitesini ve deplasman miktarını belirlemek için gereklidir. Lateral grafi çekimi acil
olmamakla birlikte kırığın daha doğru değerlendirilmesi açısından önemlidir. Eğer hasta grafi masasında iken çekilemiyor ise, traksiyon masasına alındığında görülebilir.
Nadiren de olsa tanı için tomografi çekilmesi gerekli olabilir. Bunun yanında kalça kırığı şüphesi yüksek olan, ancak direk grafide kırık tanısı konulamayan hastalara MR çekilerek
tanı rahatlıkla konulabilir. Yine röntgende görünmeyen ancak kırık şüphesi yüksek olan hastalara 48-72 saat içerisinde yapılan sintigrafilerde duyarlılık % 100'dür.
"""
# 定義問題
question = "Lateral radyografi hangi durumlar için gereklidir?"
print(pipe(question=question, context=context))
✨ 主要特性
- 領域適配:針對土耳其語醫學領域的問答任務進行了微調優化,能夠更好地處理醫學專業文本。
- 精準提取:採用BERT架構,並添加了額外的Dropout正則化,有效防止過擬合,能夠準確地從醫學文本中提取答案。
- 指標優異:在測試評估集上取得了良好的成績,包括較低的損失值、較高的精確匹配率和F1分數。
📦 安裝指南
依賴安裝
使用以下命令安裝所需的依賴庫:
pip install transformers datasets torch tokenizers
模型加載
在代碼中使用 transformers
庫加載模型:
from transformers import pipeline
pipe = pipeline("question-answering", model="kaixkhazaki/turkish-question-answering")
💻 使用示例
基礎用法
# 使用pipeline作為高級輔助工具
from transformers import pipeline
pipe = pipeline("question-answering", model="kaixkhazaki/turkish-question-answering")
# 示例
## 定義上下文
context = """
Kalça kırığından şüphe duyulan hastalarda öncelikle standart grafiler çekilmelidir. Bunlar ön arka pelvis grafisi ve etkilenen kalçanın ön arka ve yan grafileridir.
Özellikle deplase olmayan kırıklarda sağlam taraf ile patolojik tarafın mukayese edilmesi önemlidir. Kırık kalçanın filmi, alt ekstremite hafif traksiyonda iken nötral pozisyonda,
patella ışın düzlemine dikey halde çekilir. Trokanter majörün en az 10 cm distaline kadar görülmesi faydalı olacaktır. Ayrıca sağlam tarafın görülmesi ile osteoporoz ve hastanın
normal boyun-cisim açısının tayininde önemlidir. Lateral radyografi posteriorda kırığın stabilitesini ve deplasman miktarını belirlemek için gereklidir. Lateral grafi çekimi acil
olmamakla birlikte kırığın daha doğru değerlendirilmesi açısından önemlidir. Eğer hasta grafi masasında iken çekilemiyor ise, traksiyon masasına alındığında görülebilir.
Nadiren de olsa tanı için tomografi çekilmesi gerekli olabilir. Bunun yanında kalça kırığı şüphesi yüksek olan, ancak direk grafide kırık tanısı konulamayan hastalara MR çekilerek
tanı rahatlıkla konulabilir. Yine röntgende görünmeyen ancak kırık şüphesi yüksek olan hastalara 48-72 saat içerisinde yapılan sintigrafilerde duyarlılık % 100'dür.
"""
# 定義問題
question = "Lateral radyografi hangi durumlar için gereklidir?"
print(pipe(question=question, context=context))
高級用法
# 可以多次調用pipeline處理不同的問題和上下文
# 示例
## 定義上下文
context = """
Kalça kırığından şüphe duyulan hastalarda öncelikle standart grafiler çekilmelidir. Bunlar ön arka pelvis grafisi ve etkilenen kalçanın ön arka ve yan grafileridir.
Özellikle deplase olmayan kırıklarda sağlam taraf ile patolojik tarafın mukayese edilmesi önemlidir. Kırık kalçanın filmi, alt ekstremite hafif traksiyonda iken nötral pozisyonda,
patella ışın düzlemine dikey halde çekilir. Trokanter majörün en az 10 cm distaline kadar görülmesi faydalı olacaktır. Ayrıca sağlam tarafın görülmesi ile osteoporoz ve hastanın
normal boyun-cisim açısının tayininde önemlidir. Lateral radyografi posteriorda kırığın stabilitesini ve deplasman miktarını belirlemek için gereklidir. Lateral grafi çekimi acil
olmamakla birlikte kırığın daha doğru değerlendirilmesi açısından önemlidir. Eğer hasta grafi masasında iken çekilemiyor ise, traksiyon masasına alındığında görülebilir.
Nadiren de olsa tanı için tomografi çekilmesi gerekli olabilir. Bunun yanında kalça kırığı şüphesi yüksek olan, ancak direk grafide kırık tanısı konulamayan hastalara MR çekilerek
tanı rahatlıkla konulabilir. Yine röntgende görünmeyen ancak kırık şüphesi yüksek olan hastalara 48-72 saat içerisinde yapılan sintigrafilerde duyarlılık % 100'dür.
"""
# 定義問題
question = "Trokanter majörün kaç cm distaline kadar görülmesi faydalıdır?"
print(pipe(question=question, context=context))
📚 詳細文檔
預期用途
- 醫學問答:為土耳其語醫學領域的問題提供答案。
- 信息提取:從土耳其語醫學文本中提取相關信息。
- 專業支持:輔助醫學專業人士和研究人員在醫學文檔中查找特定信息。
侷限性
- 專業建議替代:本模型不能替代專業的醫學建議。
- 數據偏差:模型可能反映醫學訓練數據中存在的偏差。
- 性能差異:在不同的醫學專業和術語上,模型的性能可能會有所不同。
- 複雜問題處理:不適合回答需要推理或綜合信息的複雜醫學問題。
- 領域適用性:專門為醫學領域訓練,在通用領域問題上可能表現不佳。
- 術語覆蓋:對於訓練數據中未出現的高度技術性醫學術語,模型的性能可能會受到影響。
- 問答類型:僅限於提取式問答(查找直接存在於文本中的答案)。
🔧 技術細節
訓練超參數
參數 | 值 |
---|---|
基礎模型 | dbmdz/bert-base-turkish-cased |
批量大小 | 16 |
學習率 | 1e-5 |
訓練輪數 | 10 |
權重衰減 | 0.02 |
熱身步數 | 1000 |
學習率調度器 | Cosine |
梯度裁剪 | 1.0 |
訓練精度 | BF16 |
優化器 | AdamW |
模型架構修改
參數 | 值 |
---|---|
隱藏層Dropout概率 | 0.2 |
注意力概率Dropout | 0.2 |
訓練和評估數據
模型在土耳其語醫學問答數據集上進行了訓練:
@INPROCEEDINGS{10711128,
author={İncidelen, Mert and Aydoğan, Murat},
booktitle={2024 8th International Artificial Intelligence and Data Processing Symposium (IDAP)},
title={Developing Question-Answering Models in Low-Resource Languages: A Case Study on Turkish Medical Texts Using Transformer-Based Approaches},
year={2024},
volume={},
number={},
pages={1-4},
keywords={Training;Adaptation models;Natural languages;Focusing;Encyclopedias;Transformers;Data models;Internet;Online services;Text processing;Natural Language Processing;Medical Domain;BERTurk;Question-Answering},
doi={10.1109/IDAP64064.2024.10711128}}
訓練過程
預處理
- 最大序列長度:384
- 步長:128
- 問題和上下文對:使用
BertTokenizerFast
進行分詞
評估策略
- 評估頻率:每50步進行一次評估
- 最佳模型保存:基於F1分數保存最佳模型
- 評估指標:精確匹配率和F1分數
訓練結果
訓練損失 | 輪數 | 步數 | 驗證損失 | 精確匹配率 | F1分數 |
---|---|---|---|---|---|
5.9507 | 0.1166 | 50 | 5.9381 | 0.0 | 6.0684 |
5.8385 | 0.2331 | 100 | 5.7914 | 0.0 | 6.4166 |
5.6579 | 0.3497 | 150 | 5.5785 | 0.0 | 6.1711 |
5.3863 | 0.4662 | 200 | 5.3045 | 0.2012 | 6.2450 |
5.0968 | 0.5828 | 250 | 4.9885 | 0.5976 | 7.6302 |
4.7795 | 0.6993 | 300 | 4.6415 | 1.0941 | 8.9163 |
4.4223 | 0.8159 | 350 | 4.2947 | 1.6293 | 9.4547 |
4.1392 | 0.9324 | 400 | 3.9772 | 4.6748 | 14.3025 |
3.8572 | 1.0490 | 450 | 3.4575 | 12.5448 | 27.5850 |
3.3154 | 1.1655 | 500 | 2.5605 | 28.7234 | 51.4219 |
2.8303 | 1.2821 | 550 | 2.2085 | 35.0144 | 57.9319 |
2.5985 | 1.3986 | 600 | 2.0545 | 38.8122 | 61.8230 |
2.3931 | 1.5152 | 650 | 1.9646 | 38.8283 | 62.3091 |
2.3749 | 1.6317 | 700 | 1.8911 | 42.2311 | 64.3891 |
2.3268 | 1.7483 | 750 | 1.8363 | 42.9521 | 65.1745 |
2.1324 | 1.8648 | 800 | 1.7683 | 43.2540 | 66.5840 |
2.1652 | 1.9814 | 850 | 1.6980 | 45.5979 | 67.6440 |
1.9279 | 2.0979 | 900 | 1.6432 | 46.4935 | 68.1335 |
1.9351 | 2.2145 | 950 | 1.6031 | 46.7866 | 68.4213 |
1.8488 | 2.3310 | 1000 | 1.5765 | 48.7047 | 70.2017 |
1.8967 | 2.4476 | 1050 | 1.5462 | 47.9791 | 69.8952 |
1.7476 | 2.5641 | 1100 | 1.5040 | 49.2903 | 71.0521 |
1.7635 | 2.6807 | 1150 | 1.5197 | 49.2188 | 70.7629 |
1.7595 | 2.7972 | 1200 | 1.4790 | 49.8724 | 70.5285 |
1.7699 | 2.9138 | 1250 | 1.4283 | 52.5707 | 72.8425 |
1.7792 | 3.0303 | 1300 | 1.4246 | 50.5762 | 72.0336 |
1.5396 | 3.1469 | 1350 | 1.4117 | 52.6248 | 72.8936 |
1.5112 | 3.2634 | 1400 | 1.3938 | 53.1888 | 73.1075 |
1.5936 | 3.3800 | 1450 | 1.3805 | 53.8953 | 73.4629 |
1.4775 | 3.4965 | 1500 | 1.3522 | 53.5443 | 72.8847 |
1.3998 | 3.6131 | 1550 | 1.3730 | 52.9262 | 72.7934 |
1.4743 | 3.7296 | 1600 | 1.3593 | 53.2319 | 73.0427 |
1.572 | 3.8462 | 1650 | 1.3748 | 53.7484 | 73.1917 |
1.5321 | 3.9627 | 1700 | 1.3096 | 54.2929 | 72.9719 |
1.2849 | 4.0793 | 1750 | 1.3057 | 54.1823 | 73.5710 |
1.4073 | 4.1958 | 1800 | 1.2768 | 55.1072 | 73.9657 |
1.2894 | 4.3124 | 1850 | 1.3707 | 54.0984 | 73.5854 |
1.2771 | 4.4289 | 1900 | 1.3068 | 54.9686 | 74.2854 |
1.2683 | 4.5455 | 1950 | 1.2683 | 55.6818 | 74.6788 |
1.3432 | 4.6620 | 2000 | 1.2704 | 55.3866 | 74.1082 |
1.3052 | 4.7786 | 2050 | 1.2826 | 54.5570 | 73.9376 |
1.3458 | 4.8951 | 2100 | 1.2436 | 54.4304 | 74.1391 |
1.1832 | 5.0117 | 2150 | 1.2914 | 55.8081 | 74.5105 |
1.1964 | 5.1282 | 2200 | 1.2332 | 56.8182 | 75.6849 |
1.1179 | 5.2448 | 2250 | 1.2661 | 55.5273 | 74.5969 |
1.1602 | 5.3613 | 2300 | 1.2717 | 56.0203 | 75.5936 |
1.1314 | 5.4779 | 2350 | 1.2784 | 55.5133 | 75.2080 |
1.2153 | 5.5944 | 2400 | 1.2401 | 56.3682 | 75.6323 |
1.1613 | 5.7110 | 2450 | 1.2470 | 55.8081 | 75.5565 |
1.0839 | 5.8275 | 2500 | 1.2555 | 56.2108 | 75.3284 |
1.1208 | 5.9441 | 2550 | 1.2151 | 56.0606 | 75.3103 |
1.1018 | 6.0606 | 2600 | 1.2407 | 56.2814 | 75.4373 |
1.004 | 6.1772 | 2650 | 1.2561 | 56.1869 | 75.1453 |
1.0081 | 6.2937 | 2700 | 1.2708 | 56.3843 | 75.1235 |
1.0503 | 6.4103 | 2750 | 1.2398 | 56.4780 | 75.2607 |
1.1078 | 6.5268 | 2800 | 1.2424 | 56.1558 | 75.4293 |
1.0516 | 6.6434 | 2850 | 1.2425 | 57.0342 | 76.0343 |
1.0919 | 6.7599 | 2900 | 1.2361 | 56.5107 | 75.1984 |
1.0834 | 6.8765 | 2950 | 1.2307 | 56.6158 | 75.4564 |
1.0308 | 6.9930 | 3000 | 1.2331 | 55.9236 | 75.7649 |
0.9756 | 7.1096 | 3050 | 1.2354 | 56.9250 | 76.0355 |
0.9279 | 7.2261 | 3100 | 1.2538 | 56.4168 | 75.7899 |
0.9655 | 7.3427 | 3150 | 1.2458 | 56.4885 | 76.0547 |
0.9776 | 7.4592 | 3200 | 1.2351 | 57.0701 | 76.0798 |
0.925 | 7.5758 | 3250 | 1.2309 | 56.6158 | 75.7755 |
1.0088 | 7.6923 | 3300 | 1.2403 | 56.2897 | 75.7209 |
1.0534 | 7.8089 | 3350 | 1.2426 | 55.1592 | 75.2877 |
1.0021 | 7.9254 | 3400 | 1.2364 | 55.9645 | 75.4818 |
0.9248 | 8.0420 | 3450 | 1.2420 | 55.5838 | 75.7577 |
0.9077 | 8.1585 | 3500 | 1.2389 | 56.0051 | 75.6164 |
0.9882 | 8.2751 | 3550 | 1.2259 | 55.8228 | 75.5104 |
0.9151 | 8.3916 | 3600 | 1.2330 | 56.5272 | 76.1745 |
0.9682 | 8.5082 | 3650 | 1.2406 | 56.6372 | 75.9005 |
1.0271 | 8.6247 | 3700 | 1.2343 | 56.4557 | 75.7307 |
0.9019 | 8.7413 | 3750 | 1.2343 | 56.3291 | 75.8930 |
0.8673 | 8.8578 | 3800 | 1.2379 | 56.2183 | 75.9115 |
0.91 | 8.9744 | 3850 | 1.2421 | 56.0759 | 75.8580 |
0.8888 | 9.0909 | 3900 | 1.2399 | 56.2183 | 76.0760 |
0.874 | 9.2075 | 3950 | 1.2438 | 56.0203 | 75.8630 |
0.9676 | 9.3240 | 4000 | 1.2445 | 56.2738 | 76.0027 |
0.9712 | 9.4406 | 4050 | 1.2413 | 56.1470 | 76.0020 |
0.8792 | 9.5571 | 4100 | 1.2416 | 56.1470 | 75.9679 |
0.9358 | 9.6737 | 4150 | 1.2406 | 56.4005 | 75.9939 |
0.8496 | 9.7902 | 4200 | 1.2411 | 56.4005 | 76.0539 |
0.9618 | 9.9068 | 4250 | 1.2412 | 56.2738 | 76.0405 |
框架版本
- Transformers 4.48.0.dev0
- Pytorch 2.4.1+cu121
- Datasets 3.1.0
- Tokenizers 0.21.0
📄 許可證
本模型採用MIT許可證。
📚 引用
@misc{turkish-medical-question-answering,
author = {Fatih Demirci},
title = {Turkish Medical Question Answering Model},
year = {2024},
publisher = {HuggingFace},
journal = {HuggingFace Model Hub},
howpublished = {\url{https://huggingface.co/kaixkhazaki/turkish-medical-question-answering}}
}
Distilbert Base Cased Distilled Squad
Apache-2.0
DistilBERT是BERT的輕量級蒸餾版本,參數量減少40%,速度提升60%,保留95%以上性能。本模型是在SQuAD v1.1數據集上微調的問答專用版本。
問答系統 英語
D
distilbert
220.76k
244
Distilbert Base Uncased Distilled Squad
Apache-2.0
DistilBERT是BERT的輕量級蒸餾版本,參數量減少40%,速度提升60%,在GLUE基準測試中保持BERT 95%以上的性能。本模型專為問答任務微調。
問答系統
Transformers 英語

D
distilbert
154.39k
115
Tapas Large Finetuned Wtq
Apache-2.0
TAPAS是基於BERT架構的表格問答模型,通過自監督方式在維基百科表格數據上預訓練,支持對錶格內容進行自然語言問答
問答系統
Transformers 英語

T
google
124.85k
141
T5 Base Question Generator
基於t5-base的問答生成模型,輸入答案和上下文,輸出相應問題
問答系統
Transformers

T
iarfmoose
122.74k
57
Bert Base Cased Qa Evaluator
基於BERT-base-cased的問答對評估模型,用於判斷問題和答案是否語義相關
問答系統
B
iarfmoose
122.54k
9
Tiny Doc Qa Vision Encoder Decoder
MIT
一個基於MIT許可證的文檔問答模型,主要用於測試目的。
問答系統
Transformers

T
fxmarty
41.08k
16
Dpr Question Encoder Single Nq Base
DPR(密集段落檢索)是用於開放領域問答研究的工具和模型。該模型是基於BERT的問題編碼器,使用自然問題(NQ)數據集訓練。
問答系統
Transformers 英語

D
facebook
32.90k
30
Mobilebert Uncased Squad V2
MIT
MobileBERT是BERT_LARGE的輕量化版本,在SQuAD2.0數據集上微調而成的問答系統模型。
問答系統
Transformers 英語

M
csarron
29.11k
7
Tapas Base Finetuned Wtq
Apache-2.0
TAPAS是一個基於Transformer的表格問答模型,通過自監督學習在維基百科表格數據上預訓練,並在WTQ等數據集上微調。
問答系統
Transformers 英語

T
google
23.03k
217
Dpr Question Encoder Multiset Base
基於BERT的密集段落檢索(DPR)問題編碼器,用於開放領域問答研究,在多個QA數據集上訓練
問答系統
Transformers 英語

D
facebook
17.51k
4
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98