M

Medcpt Query Encoder

由ncbi開發
MedCPT 是一個能夠生成生物醫學文本嵌入向量的模型,特別適用於語義搜索(密集檢索)任務。
下載量 73.74k
發布時間 : 10/24/2023

模型概述

MedCPT 包含查詢編碼器和文章編碼器兩個部分,能夠計算短文本和文章的嵌入向量,用於生物醫學領域的語義搜索、聚類等任務。

模型特點

大規模預訓練
通過2.55億對PubMed搜索日誌中的查詢-文章對進行預訓練
零樣本性能優異
在多個零樣本生物醫學信息檢索數據集上實現了最先進的性能
雙編碼器架構
包含專門的查詢編碼器和文章編碼器,分別優化不同類型文本的表示

模型能力

生物醫學文本嵌入生成
語義搜索
文本聚類
查詢-文章匹配

使用案例

信息檢索
PubMed文獻搜索
使用查詢編碼器生成搜索查詢的嵌入,與預計算的文章嵌入進行匹配
提供更準確的生物醫學文獻檢索結果
文本分析
查詢聚類
使用查詢編碼器對生物醫學查詢進行表示和聚類分析
發現相似查詢模式和用戶意圖
文章相似性分析
使用文章編碼器計算文獻之間的語義相似度
識別相關研究文獻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase