M3D CLIP
M3D-CLIPは3D医用画像専用に設計されたCLIPモデルで、コントラスト損失により視覚と言語のアラインメントを実現します。
ダウンロード数 2,962
リリース時間 : 4/25/2024
モデル概要
M3D-CLIPは3D ViTアーキテクチャに基づく視覚-言語モデルで、3D医用画像とテキストのクロスモーダル検索と特徴抽出に特化しています。
モデル特徴
3D医用画像専用
3D医用画像専用に設計され、3D ViTアーキテクチャを使用して32*256*256サイズの3D画像を処理します
クロスモーダルアラインメント
コントラスト損失により3D医用画像とテキストの意味的アラインメントを実現
強力な特徴表現
下流タスク向けにアラインメントされた強力な画像テキスト特徴を提供
事前学習の利点
テキストアラインメントされた視覚エンコーダは、視覚/マルチモーダルタスクの優れた事前学習モデルとして使用可能
モデル能力
3D医用画像特徴抽出
医用画像テキストクロスモーダル検索
医用画像意味理解
マルチモーダル表現学習
使用事例
医用画像分析
医用画像検索
テキスト記述に基づいて関連する3D医用画像を検索
効率的で正確なクロスモーダル検索能力
医用レポート生成
3D医用画像に対して記述的テキストを生成
医用画像分類
アラインメントされた特徴を利用して画像分類を実施
医学研究
医学知識マイニング
大規模な医用画像とテキストデータから関連知識を発見
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98