D

Dse Qwen2 2b Mrl V1

MrLightによって開発
DSE-QWen2-2b-MRL-V1 は、文書スクリーンショットを密なベクトルにエンコードして文書検索を実現するために設計されたデュアルエンコーダーモデルです。
ダウンロード数 4,447
リリース時間 : 9/11/2024

モデル概要

このモデルは文書スクリーンショット埋め込み(DSE)手法を採用し、元の視覚形式で文書をキャプチャし、テキスト、画像、レイアウトなどのすべての情報を保持し、煩雑な解析や潜在的な情報損失を回避します。テキスト、PDF文書、ウェブページ、スライドの検索に汎用的な埋め込みモデルを提供することを目的としています。

モデル特徴

オリジナル視覚形式処理
文書スクリーンショットを直接処理し、元のレイアウト、テキスト、画像情報を保持
柔軟な表現次元
効果と効率のバランスを取るために出力埋め込み次元の調整をサポート
柔軟な入力サイズ
GPUリソースに応じて入力画像サイズを調整可能
多言語サポート
英語とフランス語の文書処理をサポート

モデル能力

文書スクリーンショット埋め込み
密ベクトル検索
クロスモーダル文書理解
多言語文書処理

使用事例

文書検索
学術論文検索
論文スクリーンショットを通じて関連文献を検索
ViDoREベンチマークで85.8のnDCG@5を達成
企業文書管理
PDF、PPTなどの企業文書を迅速に検索
クロスモーダル検索
テキストと画像の混合検索
文書内のテキストと視覚情報を同時に処理して検索
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase