N

Nuextract 2.0 8B

由numind開發
NuExtract 2.0是專為結構化信息提取任務訓練的多模態模型系列,支持文本和圖像輸入,具備多語言處理能力。
下載量 328
發布時間 : 5/6/2025

模型概述

基於Qwen2.5-VL-7B-Instruct微調的結構化信息提取模型,支持從文本或圖像中提取指定格式的結構化數據。

模型特點

多模態支持
同時支持文本和圖像輸入,可從多種數據源提取結構化信息
模板驅動
通過JSON模板定義輸出結構,靈活適應不同提取需求
上下文學習
支持提供示例樣本(in-context learning)提升複雜場景下的提取準確率
類型系統
內置豐富的數據類型支持(字符串/數字/日期/枚舉等)

模型能力

文本信息提取
圖像內容解析
多語言處理
結構化數據生成
模板自動生成

使用案例

文檔處理
合同信息提取
從法律合同中提取關鍵條款、日期和簽署方信息
輸出結構化JSON數據
發票識別
從掃描發票中提取商戶、金額、日期等信息
自動生成財務系統可讀數據
零售場景
商品標籤識別
從商品圖片中提取價格、規格等信息
生成標準化的產品數據庫
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase