N

Nuextract 2.0 8B

由 numind 开发
NuExtract 2.0是专为结构化信息提取任务训练的多模态模型系列,支持文本和图像输入,具备多语言处理能力。
下载量 328
发布时间 : 5/6/2025

模型简介

基于Qwen2.5-VL-7B-Instruct微调的结构化信息提取模型,支持从文本或图像中提取指定格式的结构化数据。

模型特点

多模态支持
同时支持文本和图像输入,可从多种数据源提取结构化信息
模板驱动
通过JSON模板定义输出结构,灵活适应不同提取需求
上下文学习
支持提供示例样本(in-context learning)提升复杂场景下的提取准确率
类型系统
内置丰富的数据类型支持(字符串/数字/日期/枚举等)

模型能力

文本信息提取
图像内容解析
多语言处理
结构化数据生成
模板自动生成

使用案例

文档处理
合同信息提取
从法律合同中提取关键条款、日期和签署方信息
输出结构化JSON数据
发票识别
从扫描发票中提取商户、金额、日期等信息
自动生成财务系统可读数据
零售场景
商品标签识别
从商品图片中提取价格、规格等信息
生成标准化的产品数据库
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase