开源事实核查模型 - 免费部署，精准判断主张与证据是否相符

首页

Fact Checking

由 fractalego 开发

该模型基于FEVER数据集训练，用于预测某项主张是否与提供的证据相符。

大型语言模型

Transformers

#事实核查 #证据匹配 #高精确率

下载量 79

发布时间 : 3/2/2022

模型简介

这是一个生成模型，旨在通过分析提供的证据来验证主张的真实性。它可以输出布尔值或概率化的验证结果。

模型特点

高精度验证

在FEVER开发集子集上达到0.94精确率和0.98召回率

概率化输出

支持通过多次迭代生成包含概率成分的验证结果

简单易用

提供简洁的API接口，便于集成到现有系统中

模型能力

文本证据分析

主张真实性验证

概率化结果输出

使用案例

内容审核

新闻事实核查

验证新闻报道中的主张是否与已知证据相符

可自动识别虚假或未经证实的主张

学术研究

论文引用验证

检查学术论文中的引用是否准确反映原始文献内容

帮助研究者确保引用准确性

🚀 事实核查

本生成式模型基于FEVER数据集进行训练，旨在预测某一陈述是否与所提供的证据相符。

🚀 快速开始

本模型可用于预测陈述与证据的一致性，通过简单的安装和代码调用即可使用。

📦 安装指南

一种快速安装该工具的方法是在命令行中输入以下命令：

pip install fact_checking

💻 使用示例

基础用法

安装完成后，可使用以下代码进行基本的事实核查：

from transformers import (
    GPT2LMHeadModel,
    GPT2Tokenizer,
)

from fact_checking import FactChecker

_evidence = """
Justine Tanya Bateman (born February 19, 1966) is an American writer, producer, and actress . She is best known for her regular role as Mallory Keaton on the sitcom Family Ties (1982 -- 1989). Until recently, Bateman ran a production and consulting company, SECTION 5 . In the fall of 2012, she started studying computer science at UCLA.
"""

_claim = 'Justine Bateman is a poet.'

tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
fact_checking_model = GPT2LMHeadModel.from_pretrained('fractalego/fact-checking')
fact_checker = FactChecker(fact_checking_model, tokenizer)
is_claim_true = fact_checker.validate(_evidence, _claim)

print(is_claim_true)

上述代码运行后，输出结果如下：

False

高级用法

输出结果可以包含概率成分，通过多次迭代输出生成过程来实现。系统会生成一组答案，并按“是”或“否”进行分组。例如：

from transformers import (
    GPT2LMHeadModel,
    GPT2Tokenizer,
)

from fact_checking import FactChecker

_evidence = """
Jane writes code for Huggingface.
"""

_claim = 'Jane is an engineer.'


tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
fact_checking_model = GPT2LMHeadModel.from_pretrained('fractalego/fact-checking')
fact_checker = FactChecker(fact_checking_model, tokenizer)
is_claim_true = fact_checker.validate_with_replicas(_evidence, _claim)

print(is_claim_true)

运行上述代码，输出结果如下：