M

Matcha Base

googleによって開発
MatChaはグラフ理解と数学的推論に特化した視覚言語モデルで、グラフと言語データの共同モデリングにより処理能力を強化
ダウンロード数 2,445
リリース時間 : 4/3/2023

モデル概要

このモデルはPix2Structアーキテクチャを基盤とし、グラフ解読や数値推論タスク向けに事前学習されており、PlotQAやChartQAなどのベンチマークで優れた性能を発揮

モデル特徴

グラフ解読能力
特別設計された事前学習タスクにより、グラフ内の視覚要素やデータ構造を効果的に解析可能
数値推論能力
数学的計算と論理的推論能力を強化し、グラフ内の数値関係分析を処理可能
分野横断的転移
スクリーンショット、教科書グラフ、文書挿絵など多様な視覚言語タスクで良好な転移効果を発揮

モデル能力

グラフ内容理解
視覚的質問応答
数値計算推論
多言語グラフ分析

使用事例

データ分析
ビジネスグラフ分析
棒グラフ/折れ線グラフのデータトレンドや主要指標を自動解釈
ChartQAベンチマークで従来の最良手法を20%上回る
教育支援
教科書グラフ理解
教材内の複雑なグラフを解析し文章説明を生成
教科書グラフ領域での転移効果を検証
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase