S

Stockmark 2 VL 100B Beta

Developed by stockmark
Stockmark-2-VL-100B-betaは1000億のパラメータを持つ日本語専用のビジュアル言語モデルで、思考連鎖(CoT)推論能力を備え、文書読解に使用できます。
Downloads 184
Release Time : 5/27/2025

Model Overview

このモデルは日本語シーンに合わせて最適化され、画像とテキスト情報を組み合わせて、より豊かなインタラクションを実現し、日本語文書読解などのタスクに適しています。

Model Features

日本語最適化
日本語シーン向けに設計され、日本語文書読解などのタスクに合わせて最適化されています。
思考連鎖推論
CoT推論能力を備え、文書理解と回答の論理性を向上させます。
マルチモーダル処理
画像とテキスト情報を組み合わせて、より豊かなインタラクションを実現します。
高性能ビジュアルエンコーダ
google/siglip2 - so400m - patch14 - 384をビジュアルエンコーダとして採用し、より良い多言語性能を持っています。

Model Capabilities

文書読解
ビジュアル質問応答
画像とテキストの結合分析
マルチモーダル推論

Use Cases

ビジネス分析
ビジネススライド分析
複雑な日本語ビジネススライド画像の内容を理解し、質問に答えます。
BusinessSlideVQAベンチマークテストで4.2点を獲得し、GPT - 4oより優れています。
データ可視化
グラフ理解
日本語のグラフ画像を分析し、関連する質問に答えます。
JChartQAベンチマークテストで0.88の正解率を達成しました。
文書処理
日本語文書理解
日本語文書の内容を読み、理解して質問に答えます。
JDocQAベンチマークテストで3.5点を獲得しました。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase