Tessar-largest开源表格推理模型 - 免费助力突破表格信息理解局限

首页

Tessar Largest

由 SVECTOR-CORPORATION 开发

Tessar是由SVECTOR开发的先进表格推理模型，基于突破性研究成果，不断拓展神经表格理解的边界。

问答系统

Safetensors

英语开源协议:MIT #神经SQL执行 #表格推理 #多步查询处理

下载量 101

发布时间 : 3/25/2025

模型简介

Tessar是一款专精于表格问答的复杂神经模型，实现了创新的神经SQL执行器，能以惊人精度解析和推理复杂表格数据。

模型特点

先进的神经SQL执行能力

能够解析和执行复杂的SQL查询，实现精确的表格数据推理

复杂表格问答处理

擅长处理多步查询和复杂表格推理任务

上下文关系捕捉

通过双向编码器和自回归解码器设计，有效捕捉表格数据中的复杂上下文关系

模型能力

表格数据解析

SQL查询执行

多步推理

复杂问答处理

上下文理解

使用案例

数据查询

表格数据查询

根据表格查询特定信息，如'北京在哪一年举办了奥运会？'

准确返回查询结果，如'2008.0'

数据比较

比较表格中的不同数据项

返回比较结果或差异值

数据分析

趋势分析

分析表格数据中的趋势或模式

识别并返回趋势描述或关键数据点

🚀 泰萨尔（大型模型）

泰萨尔（Tessar）是由SVECTOR开发的先进表格推理模型，它基于开创性研究，突破了神经表格理解的界限，旨在高效解决基于表格的问答问题。

🚀 快速开始

泰萨尔（Textual SQL Analysis and Reasoning）是一款复杂的神经模型，专为在基于表格的问答中表现出色而设计。它实现了一种创新的神经SQL执行器，能够以极高的精度解释和推理复杂的表格数据。

该模型采用BART架构构建，具有双向编码器和自回归解码器。这种设计使泰萨尔能够捕捉表格数据内复杂的上下文关系，并生成准确、与上下文相关的答案。

✨ 主要特性

先进的神经SQL执行能力
在复杂表格问答方面达到了最先进的性能
能够稳健处理细微和多步骤的查询
在WikiTableQuestions数据集上进行了微调

📚 详细文档

预期用途

泰萨尔在解决跨多个领域的复杂基于表格的问题方面特别强大。以下是该模型可以有效解决的一些示例问题：

问题	示例答案
根据表格，最后产生的标题是什么？	具体标题
特定比较指标的差异是多少？	数值差异
在给定上下文中，哪个实体产生了最重大的影响？	确定的实体
特定列中的第一个和最后一个条目是什么？	比较条目

使用方法

以下是一个使用Transformers库使用泰萨尔的完整示例：

from transformers import TessarTokenizer, BartForConditionalGeneration
import pandas as pd

# 加载泰萨尔模型和分词器
tokenizer = TessarTokenizer.from_pretrained("SVECTOR-CORPORATION/Tessar-largest")
model = BartForConditionalGeneration.from_pretrained("SVECTOR-CORPORATION/Tessar-largest")

# 准备示例表格数据
data = {
    "year": [1896, 1900, 1904, 2004, 2008, 2012],
    "city": ["athens", "paris", "st. louis", "athens", "beijing", "london"]
}
table = pd.DataFrame.from_dict(data)

# 提出特定查询
query = "In which year did beijing host the Olympic Games?"
encoding = tokenizer(table=table, query=query, return_tensors="pt")

# 生成答案
outputs = model.generate(**encoding)

# 解码并打印结果
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
# 预期输出: [' 2008.0']

评估

有关全面的评估脚本和基准测试，请参考SVECTOR文档和研究仓库。

性能亮点

在复杂表格推理任务上具有出色的准确性
能够稳健处理多步骤和上下文查询
在WikiTableQuestions数据集上达到了最先进的性能

引用

如果您在研究中使用泰萨尔（Tessar）的SVECTOR实现，请使用以下引用：

@inproceedings{svector2025tessar,
    title={{Tessar}: Advanced Neural Table Reasoning},
    author={{SVECTOR Team}},
    year={2025},
    institution={SVECTOR Research}
}