M3D LaMed Llama 2 7B
M3Dはマルチモーダル大規模言語モデルに基づく3D医療画像解析技術で、M3D-Dataデータセット、M3D-LaMedモデル、M3D-Bench評価基準を含みます。
ダウンロード数 209
リリース時間 : 4/27/2024
モデル概要
M3D-LaMedはM3D-CLIP事前学習視覚エンコーダーを搭載した多機能マルチモーダルモデルで、画像テキスト検索、レポート生成、視覚的質問応答、位置特定とセグメンテーションなどのタスクをサポートします。
モデル特徴
マルチモーダル3D医療画像解析
3D医療画像データの処理をサポートし、マルチモーダル医療画像解析を実現
多機能タスクサポート
画像テキスト検索、レポート生成、視覚的質問応答、位置特定とセグメンテーションなど多様なタスクを実行可能
大規模事前学習データ
M3D-Dataデータセットに基づいて訓練され、12万の画像テキストペアと66.2万の命令-応答ペアを含む
モデル能力
3D医療画像解析
医療レポート生成
視覚的質問応答
臓器セグメンテーション
バウンディングボックス注釈
画像テキスト検索
使用事例
医療画像診断
肝臓領域セグメンテーション
3D医療画像内の肝臓領域を識別し分割
セグメンテーションマスクを出力
医療レポート生成
3D医療画像に基づき検査所見の記述テキストを自動生成
自然言語レポートを生成
医療画像分析
臓器位置特定
画像内の特定臓器のバウンディングボックスを注釈
バウンディングボックス座標を出力
医療画像質問応答
3D医療画像内容に関する専門的な質問に回答
正確な医学的説明を提供
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98