G

Granite Vision 3.3 2b Embedding

ibm-graniteによって開発
granite-vision-3.3-2bをベースに構築された効率的な埋め込みモデルで、マルチモーダル文書検索用に設計されており、表、グラフ、インフォグラフィック、複雑なレイアウトを含む文書を処理できます。
ダウンロード数 205
リリース時間 : 6/3/2025

モデル概要

このモデルはColBERTスタイルの多ベクトルページ表現を生成し、OCRに基づくテキスト抽出を必要とせず、RAGパイプラインを簡素化および高速化できます。

モデル特徴

マルチモーダル文書処理
表、グラフ、インフォグラフィック、複雑なレイアウトを含む文書を処理できます。
ColBERTスタイル表現
ページのColBERTスタイルの多ベクトル表現を生成し、検索効率を向上させます。
OCR不要
OCRに基づくテキスト抽出を必要とせず、RAGパイプラインを簡素化します。
効率的な検索
マルチモーダル文書検索の高速化を目的として最適化されています。

モデル能力

マルチモーダル文書埋め込み
画像 - テキスト類似度計算
複雑なレイアウト文書処理
クロスモーダル検索

使用事例

文書検索
財務報告検索
表やグラフを含む財務報告から関連情報を検索します。
FinReportデータセットでNDCG@5が70に達します。
技術文書検索
技術報告書やスライドから特定の情報を検索します。
TechReportおよびTechSlidesデータセットでNDCG@5がそれぞれ84と93に達します。
クロスモーダル検索
画像 - テキストマッチング
画像とテキスト記述の類似度を計算します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase