bert-base-japanese-v3_nli-jsnli開源模型 - 免費判斷日語句子對邏輯關係

首頁

Bert Base Japanese V3 Nli Jsnli

由akiFQC開發

基於BERT架構的日語自然語言推理模型，在JSNLI數據集上訓練，用於判斷句子對間的邏輯關係（蘊含/中立/矛盾）

文本分類

Safetensors

支持多種語言#日語NLI #零樣本分類 #BERT交叉編碼

下載量 203

發布時間 : 4/11/2024

模型概述

該模型是基於tohoku-nlp/bert-base-japanese-v3訓練的交叉編碼器，專門用於日語自然語言推理任務，可輸出句子對間的邏輯關係概率分佈。

模型特點

日語專用模型

基於tohoku-nlp日語BERT優化，專門處理日語文本推理任務

交叉編碼架構

採用句子對聯合編碼方式，比雙編碼器更能捕捉句子間細粒度關係

零樣本分類能力

支持不經過微調直接應用於文本分類任務

模型能力

自然語言推理

零樣本分類

文本語義關係判斷

使用案例

文本理解

邏輯一致性驗證

驗證兩個日語句子是否存在蘊含或矛盾關係

可輸出三種關係概率分佈

智能客服

問答對驗證

判斷用戶問題與知識庫答案的邏輯匹配度

🚀 日語自然語言推理（NLI）交叉編碼器

本模型是用於日語自然語言推理的交叉編碼器，基於特定數據集訓練，能輸出句子對不同標籤的得分，還可用於零樣本分類等任務。

🚀 快速開始

考慮到 JNLI 評估結果，我們推薦使用 akiFQC/bert-base-japanese-v3_nli-jsnli-jnli-jsick 進行日語自然語言推理。

本模型使用 SentenceTransformers 的 Cross-Encoder 類進行訓練，基於 tohoku-nlp/bert-base-japanese-v3 構建。

✨ 主要特性

基於特定數據集訓練，可對給定句子對輸出對應標籤的得分。
支持多種使用方式，包括使用預訓練模型和直接使用 Transformers 庫。
可用於零樣本分類任務。

📦 安裝指南

文檔未提及具體安裝步驟，可參考相關庫（SentenceTransformers、Transformers）的官方文檔進行安裝。

💻 使用示例

基礎用法

預訓練模型的使用方式如下：

from sentence_transformers import CrossEncoder
model = CrossEncoder('akiFQC/bert-base-japanese-v3_nli-jsnli')
scores = model.predict([('男はピザを食べています', '男は何かを食べています'), ('黒いレーシングカーが観眾の前から発車します。', '男は誰もいない道を運転しています。')])

#Convert scores to labels
label_mapping = ['entailment', 'neutral', 'contradiction',]
labels = [label_mapping[score_max] for score_max in scores.argmax(axis=1)]

高級用法

直接使用 Transformers 庫（不使用 SentenceTransformers 庫）的方式：

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/nli-deberta-v3-base')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/nli-deberta-v3-base')

features = tokenizer(['男はピザを食べています', '黒いレーシングカーが観眾の前から発車します。'], ['男は何かを食べています', '男は誰もいない道を運転しています。'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    label_mapping = ['contradiction', 'entailment', 'neutral']
    labels = [label_mapping[score_max] for score_max in scores.argmax(dim=1)]
    print(labels)

零樣本分類用法

本模型還可用於零樣本分類：

from transformers import pipeline

classifier = pipeline("zero-shot-classification", model='akiFQC/bert-base-japanese-v3_nli-jsnli')

sent = "Appleは先程、iPhoneの最新機種について発表しました。"
candidate_labels = ["技術", "スポーツ", "政治"]
res = classifier(sent, candidate_labels)
print(res)