開源事實核查模型 - 免費部署，精準判斷主張與證據是否相符

首頁

Fact Checking

由fractalego開發

該模型基於FEVER數據集訓練，用於預測某項主張是否與提供的證據相符。

大型語言模型

Transformers

#事實核查 #證據匹配 #高精確率

下載量 79

發布時間 : 3/2/2022

模型概述

這是一個生成模型，旨在通過分析提供的證據來驗證主張的真實性。它可以輸出布爾值或概率化的驗證結果。

模型特點

高精度驗證

在FEVER開發集子集上達到0.94精確率和0.98召回率

概率化輸出

支持通過多次迭代生成包含概率成分的驗證結果

簡單易用

提供簡潔的API接口，便於集成到現有系統中

模型能力

文本證據分析

主張真實性驗證

概率化結果輸出

使用案例

內容審核

新聞事實核查

驗證新聞報道中的主張是否與已知證據相符

可自動識別虛假或未經證實的主張

學術研究

論文引用驗證

檢查學術論文中的引用是否準確反映原始文獻內容

幫助研究者確保引用準確性

🚀 事實核查

本生成式模型基於FEVER數據集進行訓練，旨在預測某一陳述是否與所提供的證據相符。

🚀 快速開始

本模型可用於預測陳述與證據的一致性，通過簡單的安裝和代碼調用即可使用。

📦 安裝指南

一種快速安裝該工具的方法是在命令行中輸入以下命令：

pip install fact_checking

💻 使用示例

基礎用法

安裝完成後，可使用以下代碼進行基本的事實核查：

from transformers import (
    GPT2LMHeadModel,
    GPT2Tokenizer,
)

from fact_checking import FactChecker

_evidence = """
Justine Tanya Bateman (born February 19, 1966) is an American writer, producer, and actress . She is best known for her regular role as Mallory Keaton on the sitcom Family Ties (1982 -- 1989). Until recently, Bateman ran a production and consulting company, SECTION 5 . In the fall of 2012, she started studying computer science at UCLA.
"""

_claim = 'Justine Bateman is a poet.'

tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
fact_checking_model = GPT2LMHeadModel.from_pretrained('fractalego/fact-checking')
fact_checker = FactChecker(fact_checking_model, tokenizer)
is_claim_true = fact_checker.validate(_evidence, _claim)

print(is_claim_true)

上述代碼運行後，輸出結果如下：

False

高級用法

輸出結果可以包含概率成分，通過多次迭代輸出生成過程來實現。系統會生成一組答案，並按“是”或“否”進行分組。例如：

from transformers import (
    GPT2LMHeadModel,
    GPT2Tokenizer,
)

from fact_checking import FactChecker

_evidence = """
Jane writes code for Huggingface.
"""

_claim = 'Jane is an engineer.'


tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
fact_checking_model = GPT2LMHeadModel.from_pretrained('fractalego/fact-checking')
fact_checker = FactChecker(fact_checking_model, tokenizer)
is_claim_true = fact_checker.validate_with_replicas(_evidence, _claim)

print(is_claim_true)

運行上述代碼，輸出結果如下：