M

Medcpt Query Encoder

ncbiによって開発
MedCPTは生物医学テキストの埋め込みベクトルを生成できるモデルで、特にセマンティック検索(密な検索)タスクに適しています。
ダウンロード数 73.74k
リリース時間 : 10/24/2023

モデル概要

MedCPTはクエリエンコーダと記事エンコーダの2つの部分を含み、短いテキストと記事の埋め込みベクトルを計算でき、生物医学分野のセマンティック検索、クラスタリングなどのタスクに使用されます。

モデル特徴

大規模事前学習
2.55億組のPubMed検索ログからのクエリ-記事ペアで事前学習
優れたゼロショット性能
複数のゼロショット生物医学情報検索データセットで最先端の性能を達成
デュアルエンコーダアーキテクチャ
専用のクエリエンコーダと記事エンコーダを含み、異なるタイプのテキスト表現を最適化

モデル能力

生物医学テキスト埋め込み生成
セマンティック検索
テキストクラスタリング
クエリ-記事マッチング

使用事例

情報検索
PubMed文献検索
クエリエンコーダを使用して検索クエリの埋め込みを生成し、事前計算された記事埋め込みとマッチング
より正確な生物医学文献検索結果を提供
テキスト分析
クエリクラスタリング
クエリエンコーダを使用して生物医学クエリを表現しクラスタリング分析
類似クエリパターンとユーザー意図を発見
記事類似性分析
記事エンコーダを使用して文献間のセマンティック類似度を計算
関連研究文献を識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase