Tapas Mini
TAPAS是基於Transformer架構的BERT類模型,專為處理表格數據及相關文本設計,通過自監督方式在維基百科表格數據上預訓練。
下載量 15
發布時間 : 3/2/2022
模型概述
該模型針對表格問答和表格蘊涵任務優化,支持從表格中提取信息並理解表格與文本間的關係。提供兩種位置嵌入版本:默認的相對位置嵌入(reset版)和絕對位置嵌入(no_reset版)。
模型特點
表格感知預訓練
通過掩碼語言建模和中間預訓練階段,專門學習表格結構與文本的關聯表徵
雙位置嵌入支持
提供相對位置嵌入(默認)和絕對位置嵌入兩種版本,適應不同表格處理需求
弱監督學習
預訓練過程完全基於自動生成的表格-文本對,無需人工標註數據
模型能力
表格數據理解
表格問答
表格蘊涵判斷
表格-文本關聯分析
使用案例
智能文檔處理
財務報表問答
從企業財務報表中自動回答關於營收、利潤等指標的查詢
可準確提取表格中的數值信息並關聯上下文解釋
數據分析
研究數據驗證
驗證研究論文中的陳述是否與提供的數據表格一致
可識別表格數據是否支持或反駁給定陳述
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98