polish - cross - encoder開源模型 - 免費實現波蘭語文本排序與句子相似度計算

首頁

Polish Cross Encoder

由radlab開發

這是一個基於波蘭語的交叉編碼器模型，用於文本排序和句子相似度計算。

文本嵌入

Transformers

其他#波蘭語文本排序 #問答相關性評分 #跨編碼器架構

下載量 4,106

發布時間 : 12/3/2023

模型概述

該模型基於波蘭語RoBERTa-large-v2架構，專門用於處理波蘭語文本的排序和相似度任務。

模型特點

波蘭語優化

專門針對波蘭語文本進行優化，在波蘭語任務上表現優異

交叉編碼架構

採用交叉編碼器架構，能夠更準確地計算句子對之間的相關性

句子相似度計算

能夠有效計算兩個波蘭語句子之間的語義相似度

模型能力

文本排序

句子相似度計算

波蘭語文本處理

使用案例

信息檢索

問答系統答案排序

對候選答案進行相關性排序，找出最匹配問題的答案

如示例所示，能有效區分不同答案的相關性

法律文本處理

法律文件相關性判斷

判斷法律文檔與查詢問題的相關性

如示例所示，能準確識別與判決相關的文本

🚀 波蘭語文本排序模型

該項目是一個用於文本排序的模型，基於句子轉換器技術，能夠有效處理波蘭語的文本相似度和特徵提取任務，為相關的自然語言處理應用提供支持。

🚀 快速開始

此模型主要用於文本排序任務，以下是使用該模型的示例代碼：

💻 使用示例

基礎用法

from sentence_transformers.cross_encoder import CrossEncoder

model_path = "radlab/polish-cross-encoder"
model = CrossEncoder(model_path)


questions = [
    "Jaką mamy dziś pogodę? bo Andrzej nic nie mówił.",
    "Gdzie jedzie Andrzej? Bo wczoraj był w Warszawie.",
    "Czy oskarżony się zgadza z przedstawionym wyrokiem?",
]
answers = [
    "Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.",
    "Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.",
    "Wyrok jest prawomocny i nie podlega dalszym rozważaniom.",
]
for question in questions:
    context_with_question = [(s, question) for s in answers]
    results = sorted(
        {
            idx: r for idx, r in enumerate(model.predict(context_with_question))
        }.items(),
        key=lambda x: x[1],
        reverse=True,
    )

    print(f"QUESTION: {question}")
    print("ANSWERS (sorted):")
    for idx, score in results:
        print(f"\t[{score}]\t{answers[idx]}")
    print("")

示例輸出

QUESTION: Jaką mamy dziś pogodę? bo Andrzej nic nie mówił.
ANSWERS (sorted):
        [0.016749681904911995]  Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.
        [0.01602918468415737]   Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.
        [0.016013670712709427]  Wyrok jest prawomocny i nie podlega dalszym rozważaniom.

QUESTION: Gdzie jedzie Andrzej? Bo wczoraj był w Warszawie.
ANSWERS (sorted):
        [0.5997582674026489]    Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.
        [0.4528200924396515]    Wyrok jest prawomocny i nie podlega dalszym rozważaniom.
        [0.17350871860980988]   Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.

QUESTION: Czy oskarżony się zgadza z przedstawionym wyrokiem?
ANSWERS (sorted):
        [0.8431766629219055]    Wyrok jest prawomocny i nie podlega dalszym rozważaniom.
        [0.6823258996009827]    Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.
        [0.558414101600647]     Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.

📄 許可證

本項目採用CC BY-SA 4.0許可證。

📚 詳細文檔

模型信息

屬性	詳情
模型類型	文本排序模型
訓練數據	radlab/polish-sts-dataset
基礎模型	sdadas/polish-roberta-large-v2
庫名稱	sentence-transformers
標籤	sentence-transformers、feature-extraction、sentence-similarity、transformers
適用語言	波蘭語