bert-base-turkish-cased-nli-mean-faq-mnr開源模型 - 助力土耳其語問答系統答案檢索

首頁

Bert Base Turkish Cased Nli Mean Faq Mnr

由mys開發

這是一個針對土耳其語FAQ檢索任務微調的BERT模型，能夠將問題和答案映射為768維向量，用於問答系統中的答案檢索。

文本嵌入

Transformers

#土耳其語FAQ檢索 #問答匹配優化 #企業租車場景

下載量 13

發布時間 : 3/2/2022

模型概述

該模型基於dbmdz/bert-base-turkish-cased模型，經過自然語言推理任務和FAQ檢索任務的兩階段微調。特別添加了<Q>和<A>特殊標記來區分問題和答案輸入。

模型特點

特殊標記處理

添加了<Q>和<A>特殊標記來區分問題和答案輸入，提高匹配精度

雙重微調

先經過自然語言推理任務預訓練，再針對FAQ檢索任務微調

高效檢索

通過計算問題和答案向量的餘弦相似度實現快速匹配

模型能力

土耳其語文本理解

語義相似度計算

FAQ答案檢索

問答系統支持

使用案例

客戶服務

自動FAQ應答系統

用於企業客服系統自動回答常見問題

示例顯示對租車相關問題的準確匹配

教育

學習問答機器人

幫助學生快速找到課程相關問題的答案

🚀 {MODEL_NAME}

本項目是一個用於常見問題解答（FAQ）檢索的模型，它基於預訓練的BERT模型進行微調，能夠將問題和答案映射到768維向量，適用於FAQ風格的聊天機器人和問答流水線中的答案檢索。

Google通過提供Google Cloud信用額度支持了本項目的工作。感謝Google對開源項目的支持！🎉

🚀 快速開始

本模型是 mys/bert-base-turkish-cased-nli-mean 的微調版本，用於FAQ檢索。而 mys/bert-base-turkish-cased-nli-mean 本身又是 dbmdz/bert-base-turkish-cased 針對自然語言推理（NLI）任務的微調版本。

該模型將問題和答案映射到768維向量，可用於FAQ風格的聊天機器人以及問答流水線中的答案檢索。它在 clips/mqa 數據集的土耳其語子集上進行訓練，訓練前進行了一些清理和過濾操作，並使用了多重負對稱排名損失（Multiple Negatives Symmetric Ranking loss）。

在微調之前，向分詞器添加了兩個特殊標記（即 <Q> 表示問題，<A> 表示答案），並調整了模型嵌入的大小。因此，在將序列輸入模型之前，需要在序列前添加相關標記。

請查看我的配套倉庫，瞭解該模型是如何進行微調的，以及如何在推理中使用它。以下代碼片段摘自該倉庫中的推理代碼。

💻 使用示例

基礎用法

questions = [
    "Merhaba",
    "Nasılsın?",
    "Bireysel araç kiralama yapıyor musunuz?",
    "Kurumsal araç kiralama yapıyor musunuz?"
]

answers = [
    "Merhaba, size nasıl yardımcı olabilirim?",
    "İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?",
    "Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?",
    "Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?"
]


questions = ["<Q>" + q for q in questions]
answers = ["<A>" + a for a in answers]


def answer_faq(model, tokenizer, questions, answers, return_similarities=False):
    q_len = len(questions)
    tokens = tokenizer(questions + answers, padding=True, return_tensors='tf')
    embs = model(**tokens)[0]

    attention_masks = tf.cast(tokens['attention_mask'], tf.float32)
    sample_length = tf.reduce_sum(attention_masks, axis=-1, keepdims=True)
    masked_embs = embs * tf.expand_dims(attention_masks, axis=-1)
    masked_embs = tf.reduce_sum(masked_embs, axis=1) / tf.cast(sample_length, tf.float32)
    a = tf.math.l2_normalize(masked_embs[:q_len, :], axis=1)
    b = tf.math.l2_normalize(masked_embs[q_len:, :], axis=1)

    similarities = tf.matmul(a, b, transpose_b=True)
        
    scores = tf.nn.softmax(similarities)
    results = list(zip(answers, scores.numpy().squeeze().tolist()))
    sorted_results = sorted(results, key=lambda x: x[1], reverse=True)
    sorted_results = [{"answer": answer.replace("<A>", ""), "score": f"{score:.4f}"} for answer, score in sorted_results]
    return sorted_results


for question in questions:
    results = answer_faq(model, tokenizer, [question], answers)
    print(question.replace("<Q>", ""))
    print(results)
    print("---------------------")

代碼運行輸出如下：

Merhaba
[{'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.2931'}, {'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2751'}, {'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2200'}, {'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.2118'}]
---------------------
Nasılsın?
[{'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2808'}, {'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.2623'}, {'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2320'}, {'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.2249'}]
---------------------
Bireysel araç kiralama yapıyor musunuz?
[{'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2861'}, {'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.2768'}, {'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2215'}, {'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.2156'}]
---------------------
Kurumsal araç kiralama yapıyor musunuz?
[{'answer': 'Evet, kurumsal araç kiralama hizmetleri sağlıyoruz. Size nasıl yardımcı olabilirim?', 'score': '0.3060'}, {'answer': 'Hayır, sadece Kurumsal Araç Kiralama operasyonları gerçekleştiriyoruz. Size başka nasıl yardımcı olabilirim?', 'score': '0.2929'}, {'answer': 'İyiyim, teşekkür ederim. Size nasıl yardımcı olabilirim?', 'score': '0.2066'}, {'answer': 'Merhaba, size nasıl yardımcı olabilirim?', 'score': '0.1945'}]
---------------------