deberta-v2-base-japanese-finetuned-QAe開源日語問答模型

首頁

Deberta V2 Base Japanese Finetuned QAe

由Mizuiro-sakura開發

基於deberta-v2-base-japanese微調的日語問答模型，使用DDQA數據集進行微調，適用於問答任務。

問答系統

Transformers

日語開源協議:MIT #日語問答 #駕駛領域QA #高精度匹配

下載量 73

發布時間 : 1/9/2023

模型概述

該模型是基於日語DeBERTa V2基礎模型微調的問答系統，專門用於處理日語問答任務，特別是在駕駛領域。

模型特點

日語問答優化

專門針對日語問答任務進行微調，在日語問答任務上表現優異。

駕駛領域適配

使用駕駛領域問答數據集（DDQA）進行微調，適合處理駕駛相關的問題。

高精度

在評估指標上表現出色，精確匹配達到0.804，F1分數達到0.896。

模型能力

日語問答

文本理解

答案提取

使用案例

智能客服

駕駛領域問答系統

用於構建駕駛相關的智能問答系統，回答用戶關於駕駛規則、車輛維護等問題。

精確匹配0.804，F1分數0.896

教育

日語學習輔助

幫助日語學習者理解文本內容並回答問題。

🚀 基於DeBERTa-v2的日語問答模型

本模型通過對deberta - v2 - base - japanese進行微調，使其適用於問答（Question - Answering）任務。它使用了駕駛領域問答數據集（DDQA）進行微調，可用於SQuAD等問答任務。

🚀 快速開始

安裝依賴

請安裝transformers、pytorch、sentencepiece和Juman++。

運行代碼

執行以下代碼，即可進行問答任務：

import torch
from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained('ku-nlp/deberta-v2-base-japanese')
model=AutoModelForQuestionAnswering.from_pretrained('Mizuiro-sakura/deberta-v2-base-japanese-finetuned-QAe') # 學習済みモデルの読み込み

text={
    'context':'私の名前はEIMIです。好きな食べ物は苺です。 趣味は皆さんと會話することです。',
    'question' :'好きな食べ物は何ですか'
}

input_ids=tokenizer.encode(text['question'],text['context']) # tokenizerで形態素解析しつつコードに変換する
output= model(torch.tensor([input_ids])) # 學習済みモデルを用いて解析
prediction = tokenizer.decode(input_ids[torch.argmax(output.start_logits): torch.argmax(output.end_logits)]) # 答えに該當する部分を抜き取る
print(prediction)

✨ 主要特性

基於deberta - v2 - base - japanese模型進行微調，適用於問答任務。
使用駕駛領域問答數據集（DDQA）進行訓練。
可用於SQuAD等問答任務。

📦 安裝指南

請安裝以下依賴：

transformers
pytorch
sentencepiece
Juman++

💻 使用示例

基礎用法

import torch
from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained('ku-nlp/deberta-v2-base-japanese')
model=AutoModelForQuestionAnswering.from_pretrained('Mizuiro-sakura/deberta-v2-base-japanese-finetuned-QAe') # 學習済みモデルの読み込み

text={
    'context':'私の名前はEIMIです。好きな食べ物は苺です。 趣味は皆さんと會話することです。',
    'question' :'好きな食べ物は何ですか'
}

input_ids=tokenizer.encode(text['question'],text['context']) # tokenizerで形態素解析しつつコードに変換する
output= model(torch.tensor([input_ids])) # 學習済みモデルを用いて解析
prediction = tokenizer.decode(input_ids[torch.argmax(output.start_logits): torch.argmax(output.end_logits)]) # 答えに該當する部分を抜き取る
print(prediction)