bert-base-turkish-cased-nli-mean-faq-mnr开源模型 - 助力土耳其语问答系统答案检索

首页

Bert Base Turkish Cased Nli Mean Faq Mnr

由 mys 开发

这是一个针对土耳其语FAQ检索任务微调的BERT模型，能够将问题和答案映射为768维向量，用于问答系统中的答案检索。

文本嵌入

Transformers

#土耳其语FAQ检索 #问答匹配优化 #企业租车场景

下载量 13

发布时间 : 3/2/2022

模型简介

该模型基于dbmdz/bert-base-turkish-cased模型，经过自然语言推理任务和FAQ检索任务的两阶段微调。特别添加了<Q>和<A>特殊标记来区分问题和答案输入。

模型特点

特殊标记处理

添加了<Q>和<A>特殊标记来区分问题和答案输入，提高匹配精度

双重微调

先经过自然语言推理任务预训练，再针对FAQ检索任务微调

高效检索

通过计算问题和答案向量的余弦相似度实现快速匹配

模型能力

土耳其语文本理解

语义相似度计算

FAQ答案检索

问答系统支持

使用案例

客户服务

自动FAQ应答系统

用于企业客服系统自动回答常见问题

示例显示对租车相关问题的准确匹配

教育

学习问答机器人

帮助学生快速找到课程相关问题的答案

🚀 {MODEL_NAME}

本项目是一个用于常见问题解答（FAQ）检索的模型，它基于预训练的BERT模型进行微调，能够将问题和答案映射到768维向量，适用于FAQ风格的聊天机器人和问答流水线中的答案检索。

Google通过提供Google Cloud信用额度支持了本项目的工作。感谢Google对开源项目的支持！🎉

🚀 快速开始

本模型是 mys/bert-base-turkish-cased-nli-mean 的微调版本，用于FAQ检索。而 mys/bert-base-turkish-cased-nli-mean 本身又是 dbmdz/bert-base-turkish-cased 针对自然语言推理（NLI）任务的微调版本。

该模型将问题和答案映射到768维向量，可用于FAQ风格的聊天机器人以及问答流水线中的答案检索。它在 clips/mqa 数据集的土耳其语子集上进行训练，训练前进行了一些清理和过滤操作，并使用了多重负对称排名损失（Multiple Negatives Symmetric Ranking loss）。

在微调之前，向分词器添加了两个特殊标记（即 <Q> 表示问题，<A> 表示答案），并调整了模型嵌入的大小。因此，在将序列输入模型之前，需要在序列前添加相关标记。

请查看我的配套仓库，了解该模型是如何进行微调的，以及如何在推理中使用它。以下代码片段摘自该仓库中的推理代码。

💻 使用示例

基础用法

questions = [
    "Merhaba",
    "Nasılsın?",
    "Bireysel araç kiralama yapıyor musunuz?",
    "Kurumsal araç kiralama yapıyor musunuz?"
]

answers = [
    "Merhaba, size nasıl yardımcı olabilirim?",
    "İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?",
    "Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?",
    "Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?"
]


questions = ["<Q>" + q for q in questions]
answers = ["<A>" + a for a in answers]


def answer_faq(model, tokenizer, questions, answers, return_similarities=False):
    q_len = len(questions)
    tokens = tokenizer(questions + answers, padding=True, return_tensors='tf')
    embs = model(**tokens)[0]

    attention_masks = tf.cast(tokens['attention_mask'], tf.float32)
    sample_length = tf.reduce_sum(attention_masks, axis=-1, keepdims=True)
    masked_embs = embs * tf.expand_dims(attention_masks, axis=-1)
    masked_embs = tf.reduce_sum(masked_embs, axis=1) / tf.cast(sample_length, tf.float32)
    a = tf.math.l2_normalize(masked_embs[:q_len, :], axis=1)
    b = tf.math.l2_normalize(masked_embs[q_len:, :], axis=1)

    similarities = tf.matmul(a, b, transpose_b=True)
        
    scores = tf.nn.softmax(similarities)
    results = list(zip(answers, scores.numpy().squeeze().tolist()))
    sorted_results = sorted(results, key=lambda x: x[1], reverse=True)
    sorted_results = [{"answer": answer.replace("<A>", ""), "score": f"{score:.4f}"} for answer, score in sorted_results]
    return sorted_results


for question in questions:
    results = answer_faq(model, tokenizer, [question], answers)
    print(question.replace("<Q>", ""))
    print(results)
    print("---------------------")

代码运行输出如下：

Merhaba
[{'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.2931'}, {'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2751'}, {'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2200'}, {'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.2118'}]
---------------------
Nasılsın?
[{'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2808'}, {'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.2623'}, {'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2320'}, {'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.2249'}]
---------------------
Bireysel araç kiralama yapıyor musunuz?
[{'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2861'}, {'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.2768'}, {'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2215'}, {'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.2156'}]
---------------------
Kurumsal araç kiralama yapıyor musunuz?
[{'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.3060'}, {'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2929'}, {'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2066'}, {'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.1945'}]
---------------------