self-biorag-7b-olaphオープンソース医学質問応答モデル - 専門的な医学知識の解答を無料で提供

Self Biorag 7b Olaph

dmis-labによって開発

Minbyul/selfbiorag-7b-wo-kqa_golden-iter-dpo-step3-filteredを基にファインチューニングしたバージョンで、HuggingFace MedLFQA（kqa_goldenを除く）データセットを使用して直接選好最適化(DPO)トレーニングを実施

大規模言語モデル

Transformers

英語#医療QA最適化 #DPO強化学習 #生物医学RAG

ダウンロード数 20

リリース時間 : 5/22/2024

モデル概要

このモデルは直接選好最適化(DPO)でトレーニングされた70億パラメータの言語モデルで、医療分野のQAタスクに特化し、強化学習により回答品質を最適化

モデル特徴

直接選好最適化

DPOアルゴリズムを使用したファインチューニングにより、高品質回答への選好を最適化

医療分野特化

医療QAデータセットでトレーニングされ、専門的な医療問題の処理に適している

マルチGPUトレーニング

4つのGPUを使用した分散トレーニングにより、トレーニング効率を向上

モデル能力

医療質問応答

専門分野のテキスト生成

選好学習

使用事例

医療健康

医療知識QAシステム

専門的な医療質問に回答できるインテリジェントアシスタントの構築

MedLFQAデータセットで優れた性能を発揮

医学教育ツール

医学生の教育・訓練用QAシステム

プロパティ	詳細
ベースモデル	Minbyul/selfbiorag-7b-wo-kqa_golden-iter-dpo-step3-filtered
タグ	alignment-handbook, trl, dpo, generated_from_trainer
モデル名	selfbiorag-7b-wo-kqa_golden-iter-dpo-step4-filtered
言語	en

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Self Biorag 7b Olaph

モデル概要

モデル特徴

モデル能力

使用事例

🚀 selfbiorag-7b-wo-kqa_golden-iter-dpo-step4-filtered

📦 インストール

モデル情報

🔧 技術詳細

学習ハイパーパラメータ

フレームワークバージョン