S

S PubMedBert MS MARCO

pritamdekaによって開発
MS-MARCOデータセットでPubMedBERTをファインチューニングした文変換モデルで、医学/健康テキスト分野の意味的類似度計算や情報検索タスクに適しています
ダウンロード数 30.50k
リリース時間 : 3/2/2022

モデル概要

このモデルは文や段落を768次元の密ベクトル空間にマッピングでき、医学分野の意味検索やテキストクラスタリングタスクをサポートします。microsoft/BiomedNLP-PubMedBERT-base-uncased-abstract-fulltextモデルを基にファインチューニングされ、生物医学テキストに特化して最適化されています。

モデル特徴

医学分野最適化
PubMedBERT事前学習モデルを基にしており、生物医学テキストで優れた性能を発揮
効率的な意味エンコーディング
文や段落を768次元の意味ベクトルに変換でき、豊富な意味情報を保持
MS-MARCOファインチューニング
情報検索ベンチマークデータセットMS-MARCOで特別にファインチューニングされており、検索タスクに適しています

モデル能力

文埋め込み生成
意味的類似度計算
テキストクラスタリング
情報検索
医学テキスト特徴抽出

使用事例

医学情報検索
医学文献検索システム
意味的類似度に基づく医学文献検索システムを構築し、検索関連性を向上
汎用モデルと比べて医学用語や概念をより良く理解可能
患者質問回答マッチング
患者の質問と医学知識ベースの回答を意味的にマッチング
QAシステムの精度とユーザー体験を向上
医学テキスト分析
医学レポートクラスタリング
大量の医学レポートを自動的にクラスタリング分析
類似症例や研究トレンドの発見
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase