S

Stockmark 2 VL 100B Beta

由stockmark開發
Stockmark-2-VL-100B-beta 是一款具有1000億參數的日語專用視覺語言模型,具備思維鏈(CoT)推理能力,可用於文檔閱讀理解。
下載量 184
發布時間 : 5/27/2025

模型概述

該模型針對日語場景進行優化,結合圖像和文本信息,實現更豐富的交互,適用於日語文檔閱讀理解等任務。

模型特點

日語優化
專為日語場景設計,針對日語文檔閱讀理解等任務進行優化
思維鏈推理
具備CoT推理能力,提升文檔理解和回答的邏輯性
多模態處理
結合圖像和文本信息,實現更豐富的交互
高性能視覺編碼器
採用google/siglip2-so400m-patch14-384作為視覺編碼器,具有更好的多語言性能

模型能力

文檔閱讀理解
視覺問答
圖像文本結合分析
多模態推理

使用案例

商業分析
商務幻燈片分析
理解複雜日語商務幻燈片圖像內容並回答問題
在BusinessSlideVQA基準測試中得分4.2,優於GPT-4o
數據可視化
圖表理解
分析日語圖表圖像並回答相關問題
在JChartQA基準測試中準確率達0.88
文檔處理
日語文檔理解
閱讀和理解日語文檔內容並回答問題
在JDocQA基準測試中得分3.5
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase