M

Medcpt Article Encoder

ncbiによって開発
MedCPTは生物医学テキストの埋め込み表現を生成できるモデルで、特にセマンティック検索(密な検索)タスクに適しています。
ダウンロード数 14.37k
リリース時間 : 10/24/2023

モデル概要

MedCPTには2つのエンコーダがあります:クエリエンコーダと記事エンコーダ。このモデルは記事エンコーダで、PubMedのタイトルや要約などの生物医学記事の埋め込み表現を計算するために使用されます。

モデル特徴

大規模事前学習
2.55億組のPubMed検索ログから得たクエリ-記事ペアで事前学習
優れたゼロショット性能
複数のゼロショット生物医学情報検索データセットで最先端の性能を達成
デュアルエンコーダアーキテクチャ
独立したクエリエンコーダと記事エンコーダを含み、様々なシナリオに適用可能
事前計算済み埋め込み利用可能
すべてのPubMed記事の事前計算済み埋め込み表現が公開提供されています

モデル能力

生物医学テキスト埋め込み生成
セマンティック類似度計算
ゼロショット情報検索
テキストクラスタリング

使用事例

情報検索
PubMed記事検索
クエリエンコーダと記事エンコーダを使用してクエリから記事を検索
生物医学情報検索タスクで優れた性能を発揮
テキスト分析
記事クラスタリング
記事エンコーダで生成された記事埋め込みを使用して類似記事をクラスタリング
クエリ分析
クエリエンコーダで生成されたクエリ埋め込みを使用してクエリ意図を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase