M

Modernpubmedbert

lokeshch19によって開発
PubMedデータセットを基に訓練された文変換器モデルで、複数の埋め込み次元をサポートし、生物医学テキスト処理に適しています。
ダウンロード数 380
リリース時間 : 4/16/2025

モデル概要

これはPubMedデータセットを基に訓練された文変換器モデルで、ネスト表現学習によって文や段落を複数の埋め込み次元を持つ密なベクトル空間にマッピングし、意味的テキスト類似性、意味検索、言い換えマイニングなどのタスクに適しています。

モデル特徴

複数の埋め込み次元
768、512、384、256、128などの複数の埋め込み次元をサポートし、アプリケーションのニーズに応じて柔軟に選択できます。
長シーケンスサポート
最大シーケンス長は8192トークンをサポートし、長いテキストの処理に適しています。
生物医学最適化
PubMedデータセットを基に訓練されており、生物医学および臨床テキスト処理に特に適しています。

モデル能力

意味的テキスト類似度計算
意味検索
言い換えマイニング
テキスト分類
クラスタリング

使用事例

生物医学文献処理
医学文献の類似度分析
医学文献間の意味的類似度を計算し、研究者が関連文献を迅速に見つけるのに役立ちます。
臨床診断支援
臨床テキストを分析することで、医師の診断判断を支援します。
テキストマイニング
医学テキストのクラスタリング
大量の医学テキストをクラスタリング分析し、潜在的なトピックやパターンを発見します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase