🚀 QA Model for German Language
This is a Question-Answering (QA) model trained on the MLQA dataset for the German language. The model used for fine-tuning is GBERT Large by deepset.ai.
✨ Features
- Trained on MLQA: Utilizes the MLQA dataset for training, enhancing its performance on multilingual question-answering tasks.
- Good Performance Metrics: Achieves high EM and F1 scores on both MLQA DEV and XQUAD TEST datasets.
- Handles Complex Queries: Capable of answering complex queries with decent accuracy.
📦 Installation
To use the model, you need to install the transformers
library. You can do this using the following command:
!pip install -q transformers
💻 Usage Examples
Basic Usage
from transformers import pipeline
qa_pipeline = pipeline(
"question-answering",
model="Sahajtomar/GBERTQnA",
tokenizer="Sahajtomar/GBERTQnA"
)
qa_pipeline({
'context': "Vor einigen Jahren haben Wissenschaftler ein wichtiges Mutagen identifiziert, das in unseren eigenen Zellen liegt: APOBEC, ein Protein, das normalerweise als Schutzmittel gegen Virusinfektionen fungiert. Heute hat ein Team von Schweizer und russischen Wissenschaftlern unter der Leitung von Sergey Nikolaev, Genetiker an der Universität Genf (UNIGE) in der Schweiz, entschlüsselt, wie APOBEC eine Schwäche unseres DNA-Replikationsprozesses ausnutzt, um Mutationen in unserem Genom zu induzieren.",
'question': "Welches Mutagen schützt vor Virusinfektionen?"
})
{'answer': 'APOBEC', 'end': 121, 'score': 0.9815779328346252, 'start': 115}
Advanced Usage
qa_pipeline({
"context": 'Im Juli 1944 befand sich die Rote Armee tief auf polnischem Gebiet und verfolgte die Deutschen in Richtung Warschau. In dem Wissen, dass Stalin der Idee eines unabhängigen Polens feindlich gegenüberstand, gab die polnische Exilregierung in London der unterirdischen Heimatarmee (AK) den Befehl, vor dem Eintreffen der Roten Armee zu versuchen, die Kontrolle über Warschau von den Deutschen zu übernehmen. So begann am 1. August 1944, als sich die Rote Armee der Stadt näherte, der Warschauer Aufstand. Der bewaffnete Kampf, der 48 Stunden dauern sollte, war teilweise erfolgreich, dauerte jedoch 63 Tage. Schließlich mussten die Kämpfer der Heimatarmee und die ihnen unterstützenden Zivilisten kapitulieren. Sie wurden in Kriegsgefangenenlager in Deutschland transportiert, während die gesamte Zivilbevölkerung ausgewiesen wurde. Die Zahl der polnischen Zivilisten wird auf 150.000 bis 200.000 geschätzt.',
'question': "Wer wurde nach Deutschland transportiert?"
})
{'answer': 'die Kämpfer der Heimatarmee und die ihnen unterstützenden Zivilisten',
'end': 693,
'score': 0.23357819020748138,
'start': 625}
📚 Documentation
Performance Metrics
Dataset |
EM |
F1 |
MLQA DEV (german) |
63.82 |
77.20 |
XQUAD TEST (german) |
65.96 |
80.85 |
Try it on Colab
You can try the model on Google Colab by clicking the following badge:
