D

Dewey En Beta

infgradによって開発
デューイはModernBERTアーキテクチャに基づく新しい長文埋め込みモデルで、128kのコンテキストウィンドウをサポートし、長文書検索タスクで優れた性能を発揮します。
ダウンロード数 447
リリース時間 : 3/23/2025

モデル概要

デューイモデルは長文書シナリオにおける検索性能の向上に焦点を当てており、命令型トレーニング手法を用いて埋め込みとタスクを整合させ、単一ベクトルと複数ベクトルの表現をサポートし、柔軟なテキストチャンキング機構を備えています。

モデル特徴

超長文コンテキストサポート
128kトークンまでの超長文処理能力をサポート
マルチベクトル表現
Colbertのようなマルチベクトル表現をサポート(トークン数の0.5%のみ)
効率的なエンコーディング
ModernBERTアーキテクチャの利点により、長文エンコーディング時でも効率を維持
柔軟なチャンキング
完全にカスタマイズ可能なテキスト分割戦略をサポートし、様々なアプリケーションシナリオに対応

モデル能力

長文書検索
意味的類似度計算
テキスト分類
テキストクラスタリング

使用事例

情報検索
長文書検索
超長文書を含むデータベースでの効率的な検索
LongEmbedベンチマークで0.86点を獲得し、複数の商用モデルを上回った
意味分析
意味的類似度計算
テキスト間の意味的類似度を計算
短文評価(MTEB-eng-v2)で優れた性能を発揮し、複数の7B規模モデルを上回った
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase