B

Biomedvlp BioViL T

microsoftによって開発
BioViL-Tは胸部X線画像と放射線レポートの分析に特化した視覚言語モデルで、時系列マルチモーダル事前学習により性能を向上させています。
ダウンロード数 26.39k
リリース時間 : 2/17/2023

モデル概要

BioViL-Tは胸部X線画像(CXRs)と放射線レポートの分析に特化したドメイン固有の視覚言語モデルです。このモデルは時系列マルチモーダル事前学習手法を採用し、画像とテキストのモダリティおよび結合空間に時系列情報を埋め込むことで、複数の下流タスクの性能を大幅に向上させています。

モデル特徴

時系列マルチモーダル事前学習
データポイント間の時系列構造を活用し、同じトレーニングデータセットを使用しながら下流タスクの性能を向上させます。
クロスモーダルアライメント
[CLS]トークンの潜在表現を利用してテキストと画像の埋め込みを整列させ、より良いクロスモーダル理解を実現します。
ドメイン固有最適化
胸部X線画像と放射線レポートの分野に特化して最適化されており、関連タスクで優れたパフォーマンスを発揮します。
2段階トレーニング
言語モデルはまず一般的な生物医学分野で事前学習を行い、その後放射線分野に特化したトレーニングを行うことで専門性を高めています。

モデル能力

胸部X線画像分析
放射線レポート理解
自然言語推論
フレーズ位置特定
画像分類
テキスト分類
言語デコード
クロスモーダル検索

使用事例

医療画像分析
胸部X線画像異常検出
胸部X線画像を分析し、胸水や気胸などの異常を検出します。
MS-CXR-Tベンチマークで87.77%の精度を達成
放射線レポート生成
胸部X線画像に基づいて放射線レポートを生成または補完します。
医学研究
医療画像言語処理研究
AI研究者が臨床NLPとVLPの研究課題を探求することを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase