🚀 基於MLQA數據集訓練的德語問答模型
本項目是一個基於MLQA數據集訓練的德語問答模型。使用deepset.ai的GBERT Large模型進行微調,能夠有效處理德語的問答任務,在相關評測中表現出色,並且可以對複雜問題給出較好的回答。
🚀 快速開始
環境安裝
!pip install -q transformers
模型推理
from transformers import pipeline
qa_pipeline = pipeline(
"question-answering",
model="Sahajtomar/GBERTQnA",
tokenizer="Sahajtomar/GBERTQnA"
)
qa_pipeline({
'context': "Vor einigen Jahren haben Wissenschaftler ein wichtiges Mutagen identifiziert, das in unseren eigenen Zellen liegt: APOBEC, ein Protein, das normalerweise als Schutzmittel gegen Virusinfektionen fungiert. Heute hat ein Team von Schweizer und russischen Wissenschaftlern unter der Leitung von Sergey Nikolaev, Genetiker an der Universität Genf (UNIGE) in der Schweiz, entschlüsselt, wie APOBEC eine Schwäche unseres DNA-Replikationsprozesses ausnutzt, um Mutationen in unserem Genom zu induzieren.",
'question': "Welches Mutagen schützt vor Virusinfektionen?"
})
{'answer': 'APOBEC', 'end': 121, 'score': 0.9815779328346252, 'start': 115}
複雜查詢示例
qa_pipeline({
"context": 'Im Juli 1944 befand sich die Rote Armee tief auf polnischem Gebiet und verfolgte die Deutschen in Richtung Warschau. In dem Wissen, dass Stalin der Idee eines unabhängigen Polens feindlich gegenüberstand, gab die polnische Exilregierung in London der unterirdischen Heimatarmee (AK) den Befehl, vor dem Eintreffen der Roten Armee zu versuchen, die Kontrolle über Warschau von den Deutschen zu übernehmen. So begann am 1. August 1944, als sich die Rote Armee der Stadt näherte, der Warschauer Aufstand. Der bewaffnete Kampf, der 48 Stunden dauern sollte, war teilweise erfolgreich, dauerte jedoch 63 Tage. Schließlich mussten die Kämpfer der Heimatarmee und die ihnen unterstützenden Zivilisten kapitulieren. Sie wurden in Kriegsgefangenenlager in Deutschland transportiert, während die gesamte Zivilbevölkerung ausgewiesen wurde. Die Zahl der polnischen Zivilisten wird auf 150.000 bis 200.000 geschätzt.',
'question': "Wer wurde nach Deutschland transportiert?"
})
{'answer': 'die Kämpfer der Heimatarmee und die ihnen unterstützenden Zivilisten',
'end': 693,
'score': 0.23357819020748138,
'start': 625}
你可以在Colab中嘗試運行該模型:

📚 詳細文檔
模型評估指標
數據集 |
EM |
F1 |
MLQA DEV (german) |
63.82 |
77.20 |
XQUAD TEST (german) |
65.96 |
80.85 |
模型信息
屬性 |
詳情 |
模型類型 |
基於GBERT Large微調的問答模型 |
訓練數據 |
MLQA數據集(德語) |