S

Stockmark 2 VL 100B Beta

由 stockmark 开发
Stockmark-2-VL-100B-beta 是一款具有1000亿参数的日语专用视觉语言模型,具备思维链(CoT)推理能力,可用于文档阅读理解。
下载量 184
发布时间 : 5/27/2025

模型简介

该模型针对日语场景进行优化,结合图像和文本信息,实现更丰富的交互,适用于日语文档阅读理解等任务。

模型特点

日语优化
专为日语场景设计,针对日语文档阅读理解等任务进行优化
思维链推理
具备CoT推理能力,提升文档理解和回答的逻辑性
多模态处理
结合图像和文本信息,实现更丰富的交互
高性能视觉编码器
采用google/siglip2-so400m-patch14-384作为视觉编码器,具有更好的多语言性能

模型能力

文档阅读理解
视觉问答
图像文本结合分析
多模态推理

使用案例

商业分析
商务幻灯片分析
理解复杂日语商务幻灯片图像内容并回答问题
在BusinessSlideVQA基准测试中得分4.2,优于GPT-4o
数据可视化
图表理解
分析日语图表图像并回答相关问题
在JChartQA基准测试中准确率达0.88
文档处理
日语文档理解
阅读和理解日语文档内容并回答问题
在JDocQA基准测试中得分3.5
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase