W

Wikimedical Sent Biobert Multi

由nuvocare開發
基於sentence-transformers的多語言醫學文本句子嵌入模型,支持8種語言
下載量 14
發布時間 : 10/20/2023

模型概述

該模型能將醫學相關句子和段落映射到768維向量空間,適用於跨語言的聚類或語義搜索任務。是WikiMedical_sent_biobert的多語言版本,基於xlm-roberta-base架構訓練。

模型特點

多語言支持
支持英語、西班牙語、法語、德語等8種語言的醫學文本處理
醫學領域優化
專門針對維基醫學內容優化的句子嵌入模型
知識蒸餾
採用教師-學生模型架構,從單語言BioBERT模型遷移知識到多語言模型

模型能力

句子向量化
跨語言語義搜索
文本聚類分析
醫學文本相似度計算

使用案例

醫療信息檢索
多語言醫學文獻檢索
構建跨語言的醫學文獻搜索引擎
可實現對不同語言醫學文獻的語義相似度匹配
臨床決策支持
多語言症狀匹配
匹配不同語言描述的症狀與疾病關聯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase