GENIE Zh 7b
G
GENIE Zh 7b
THUMedInfoによって開発
GENIEは、電子健康記録(EHR)の自由テキストを構造化し、生物医学的命名エンティティとその関連属性を抽出することを目的としたエンドツーエンドモデルです。
ダウンロード数 76
リリース時間 : 11/19/2024
モデル概要
GENIEはEHRを単一処理で処理し、生物医学的命名エンティティとそのアサーション状態、身体部位、修飾語、数値、単位、および予想される用途を抽出し、これらの情報を構造化されたJSON形式で出力します。
モデル特徴
エンドツーエンド処理
単一モデルですべての分析コンポーネントを置き換え、従来の自然言語処理ワークフローを簡素化します。
プロンプトエンジニアリング不要
一般的なLLMと比較して、GENIEはプロンプトエンジニアリングや少数のサンプルを必要としません。
効率的な処理
単一処理ですべての関連属性を生成でき、実行時間と運用コストを大幅に削減します。
構造化出力
抽出した情報を構造化されたJSON形式で出力し、後続の処理と分析を容易にします。
モデル能力
電子健康記録構造化
生物医学的命名エンティティ認識
アサーション状態抽出
身体部位認識
修飾語抽出
数値と単位抽出
予想される用途抽出
使用事例
医療健康
電子健康記録分析
自由テキストの電子健康記録から、疾患、症状、診断操作などの構造化情報を抽出します。
用語、セマンティックタイプ、叙述状態、身体部位、数値、単位、修飾語などの情報を含む構造化JSONを出力します。
臨床研究データ準備
臨床研究のために構造化された患者データを準備し、統計分析と機械学習モデルトレーニングを容易にします。
高品質の注釈付きデータを提供し、手動注釈コストを削減します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98