deberta-v2-base-japanese-finetuned-QAe开源日语问答模型

首页

Deberta V2 Base Japanese Finetuned QAe

由 Mizuiro-sakura 开发

基于deberta-v2-base-japanese微调的日语问答模型，使用DDQA数据集进行微调，适用于问答任务。

问答系统

Transformers

日语开源协议:MIT #日语问答 #驾驶领域QA #高精度匹配

下载量 73

发布时间 : 1/9/2023

模型简介

该模型是基于日语DeBERTa V2基础模型微调的问答系统，专门用于处理日语问答任务，特别是在驾驶领域。

模型特点

日语问答优化

专门针对日语问答任务进行微调，在日语问答任务上表现优异。

驾驶领域适配

使用驾驶领域问答数据集（DDQA）进行微调，适合处理驾驶相关的问题。

高精度

在评估指标上表现出色，精确匹配达到0.804，F1分数达到0.896。

模型能力

日语问答

文本理解

答案提取

使用案例

智能客服

驾驶领域问答系统

用于构建驾驶相关的智能问答系统，回答用户关于驾驶规则、车辆维护等问题。

精确匹配0.804，F1分数0.896

教育

日语学习辅助

帮助日语学习者理解文本内容并回答问题。

🚀 基于DeBERTa-v2的日语问答模型

本模型通过对deberta - v2 - base - japanese进行微调，使其适用于问答（Question - Answering）任务。它使用了驾驶领域问答数据集（DDQA）进行微调，可用于SQuAD等问答任务。

🚀 快速开始

安装依赖

请安装transformers、pytorch、sentencepiece和Juman++。

运行代码

执行以下代码，即可进行问答任务：

import torch
from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained('ku-nlp/deberta-v2-base-japanese')
model=AutoModelForQuestionAnswering.from_pretrained('Mizuiro-sakura/deberta-v2-base-japanese-finetuned-QAe') # 学習済みモデルの読み込み

text={
    'context':'私の名前はEIMIです。好きな食べ物は苺です。 趣味は皆さんと会話することです。',
    'question' :'好きな食べ物は何ですか'
}

input_ids=tokenizer.encode(text['question'],text['context']) # tokenizerで形態素解析しつつコードに変換する
output= model(torch.tensor([input_ids])) # 学習済みモデルを用いて解析
prediction = tokenizer.decode(input_ids[torch.argmax(output.start_logits): torch.argmax(output.end_logits)]) # 答えに該当する部分を抜き取る
print(prediction)

✨ 主要特性

基于deberta - v2 - base - japanese模型进行微调，适用于问答任务。
使用驾驶领域问答数据集（DDQA）进行训练。
可用于SQuAD等问答任务。

📦 安装指南

请安装以下依赖：

transformers
pytorch
sentencepiece
Juman++

💻 使用示例

基础用法

import torch
from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained('ku-nlp/deberta-v2-base-japanese')
model=AutoModelForQuestionAnswering.from_pretrained('Mizuiro-sakura/deberta-v2-base-japanese-finetuned-QAe') # 学習済みモデルの読み込み

text={
    'context':'私の名前はEIMIです。好きな食べ物は苺です。 趣味は皆さんと会話することです。',
    'question' :'好きな食べ物は何ですか'
}

input_ids=tokenizer.encode(text['question'],text['context']) # tokenizerで形態素解析しつつコードに変換する
output= model(torch.tensor([input_ids])) # 学習済みモデルを用いて解析
prediction = tokenizer.decode(input_ids[torch.argmax(output.start_logits): torch.argmax(output.end_logits)]) # 答えに該当する部分を抜き取る
print(prediction)