Apollo2-7B-iMat-GGUFオープンソース医療用大型モデル - 無料でデプロイ可能、複数言語の医学的質問応答をサポート

ホーム

Apollo2 7B Imat GGUF

cgusによって開発

Apollo2-7Bは多言語対応の医療用大規模言語モデルで、生物学と医学分野のQAタスクに特化しています。

大規模言語モデル複数言語対応オープンソースライセンス:Apache-2.0 #多言語医療QA #50言語対応 #生物学・医学専用

ダウンロード数 225

リリース時間 : 10/18/2024

モデル概要

Apollo2-7Bは多言語医療用大規模言語モデルで、50言語の医療・生物学分野のQAサポートを目的としています。医療分野の専門知識と多言語能力に特に重点を置いた密なモデルアーキテクチャを採用しています。

モデル特徴

多言語サポート

12の主要言語と38の少数言語を含む50言語をサポートし、特に医療分野の多言語能力に重点を置いています。

医療専門知識

生物学と医学分野のQAタスクに特化し、医療分野の専門知識を備えています。

量子化サポート

様々なハードウェア環境やアプリケーションシナリオに対応した複数の量子化バージョンを提供します。

モデル能力

医療QA

生物学QA

多言語QA

使用事例

医療相談

臨床知識QA

臨床医学知識に関する専門的な質問に回答

MedQA-USMLEなどの医療QAベンチマークで良好なパフォーマンス

多言語医療相談

異なる言語のユーザーに医療情報相談サービスを提供

50言語の医療QAをサポート

医学教育

医学試験準備

医学生が様々な医学試験の準備を支援

複数の医学試験ベンチマークで優れた成績

🚀 Apollo2-7B-GGUF

このモデルは、医療分野の質問応答に特化した言語モデルで、多言語に対応しています。元のモデルを量子化したもので、多くのアプリケーションで利用できます。

🚀 クイックスタート

このモデルは、llama.cpp互換のアプリケーションで実行できます。例えば、Text-Generation-WebUI、KoboldCpp、Jan、LM Studioなどです。

✨ 主な機能

多言語対応：英語、中国語、フランス語、ヒンディー語、スペイン語、アラビア語、ロシア語、日本語、韓国語、ドイツ語、イタリア語、ポルトガル語などの12の主要言語と、38のマイナー言語に対応。
医療分野特化：生物学や医学に関する質問応答に特化したモデル。
量子化モデル：llama.cpp-b3938を使用して量子化されたモデルで、実行効率が高い。

📦 インストール

インストールに関する具体的な手順は提供されていません。

💻 使用例

基本的な使用法

モデルの使用方法は、モデルの種類によって異なります。以下に例を示します。

Apollo2

0.5B, 1.5B, 7B: User:{query}\nAssistant:{response}<|endoftext|>
2B, 9B: User:{query}\nAssistant:{response}\<eos\>
3.8B: <|user|>\n{query}<|end|><|assisitant|>\n{response}<|end|>

Apollo-MoE

0.5B, 1.5B, 7B: User:{query}\nAssistant:{response}<|endoftext|>

高度な使用法

モデルの訓練や評価に関する具体的な手順は、以下の通りです。

プロジェクトのデータセットをダウンロードします。

bash 0.download_data.sh

特定のモデルのテストデータと開発データを準備します。

bash 1.data_process_test&dev.sh

特定のモデルの訓練データを準備します（事前にトークン化されたデータを作成します）。

bash 2.data_process_train.sh

モデルを訓練します。

bash 3.single_node_train.sh

モデルを評価します。

bash 4.eval.sh

📚 ドキュメント

元のモデルカード

より多くの言語で医療用LLMを民主化する

英語、中国語、フランス語、ヒンディー語、スペイン語、アラビア語、ロシア語、日本語、韓国語、ドイツ語、イタリア語、ポルトガル語を含む12の主要言語と、これまでに38のマイナー言語をカバーしています。

📃 論文 • 🌐 デモ • 🤗 ApolloMoEDataset • 🤗 ApolloMoEBench • 🤗 モデル • 🌐 Apollo • 🌐 ApolloMoE

Apollo

更新情報

[2024.10.15] ApolloMoEリポジトリが公開されました！🎉

言語カバレッジ

12の主要言語と38のマイナー言語をカバーしています。

言語カバレッジを表示するにはクリック

![ApolloMoE](https://huggingface.co/FreedomIntelligence/Apollo2-7B/resolve/main/assets/languages.png)

アーキテクチャ

MoEルーティング画像を表示するにはクリック

![ApolloMoE](https://huggingface.co/FreedomIntelligence/Apollo2-7B/resolve/main/assets/hybrid_routing.png)

結果

密モデル

🤗 Apollo2-0.5B • 🤗 Apollo2-1.5B • 🤗 Apollo2-2B 🤗 Apollo2-3.8B • 🤗 Apollo2-7B • 🤗 Apollo2-9B

密モデルの結果を表示するにはクリック

![ApolloMoE](https://huggingface.co/FreedomIntelligence/Apollo2-7B/resolve/main/assets/dense_results.png)

事後MoEモデル

🤗 Apollo-MoE-0.5B • 🤗 Apollo-MoE-1.5B • 🤗 Apollo-MoE-7B

事後MoEモデルの結果を表示するにはクリック

![ApolloMoE](https://huggingface.co/FreedomIntelligence/Apollo2-7B/resolve/main/assets/post_moe_results.png)

データセットと評価

データセット：🤗 ApolloMoEDataset

展開するにはクリック

![ApolloMoE](https://huggingface.co/FreedomIntelligence/Apollo2-7B/resolve/main/assets/Dataset.png) - [データカテゴリ](https://huggingface.co/datasets/FreedomIntelligence/ApolloCorpus/tree/main/train)

- **評価**：🤗 [ApolloMoEBench](https://huggingface.co/datasets/FreedomIntelligence/ApolloMoEBench)

展開するにはクリック

- **英語**： - [MedQA-USMLE](https://huggingface.co/datasets/GBaker/MedQA-USMLE-4-options) - [MedMCQA](https://huggingface.co/datasets/medmcqa/viewer/default/test) - [PubMedQA](https://huggingface.co/datasets/pubmed_qa)：結果の変動が大きすぎたため、論文では使用されていません。 - [MMLU-Medical](https://huggingface.co/datasets/cais/mmlu) - 臨床知識、医学遺伝学、解剖学、専門医学、大学生物学、大学医学 - **中国語**： - [MedQA-MCMLE](https://huggingface.co/datasets/bigbio/med_qa/viewer/med_qa_zh_4options_bigbio_qa/test) - [CMB-single](https://huggingface.co/datasets/FreedomIntelligence/CMB)：論文では使用されていません。 - 2,000の単一回答の選択問題をランダムにサンプリング。 - [CMMLU-Medical](https://huggingface.co/datasets/haonan-li/cmmlu) - 解剖学、臨床知識、大学医学、遺伝学、栄養学、漢方医学、ウイルス学 - [CExam](https://github.com/williamliujl/CMExam)：論文では使用されていません。 - 2,000の選択問題をランダムにサンプリング。 - **スペイン語**：[Head_qa](https://huggingface.co/datasets/head_qa) - **フランス語**： - [Frenchmedmcqa](https://github.com/qanastek/FrenchMedMCQA) - [MMLU_FR] - 臨床知識、医学遺伝学、解剖学、専門医学、大学生物学、大学医学 - **ヒンディー語**：[MMLU_HI](https://huggingface.co/datasets/FreedomIntelligence/MMLU_Hindi) - 臨床知識、医学遺伝学、解剖学、専門医学、大学生物学、大学医学 - **アラビア語**：[MMLU_AR](https://huggingface.co/datasets/FreedomIntelligence/MMLU_Arabic) - 臨床知識、医学遺伝学、解剖学、専門医学、大学生物学、大学医学 - **日本語**：[IgakuQA](https://github.com/jungokasai/IgakuQA) - **韓国語**：[KorMedMCQA](https://huggingface.co/datasets/sean0042/KorMedMCQA) - **イタリア語**： - [MedExpQA](https://huggingface.co/datasets/HiTZ/MedExpQA) - [MMLU_IT] - 臨床知識、医学遺伝学、解剖学、専門医学、大学生物学、大学医学 - **ドイツ語**：[BioInstructQA](https://huggingface.co/datasets/BioMistral/BioInstructQA)：ドイツ語部分 - **ポルトガル語**：[BioInstructQA](https://huggingface.co/datasets/BioMistral/BioInstructQA)：ポルトガル語部分 - **ロシア語**：[RuMedBench](https://github.com/sb-ai-lab/MedBench)

結果の再現

展開するにはクリック

Apollo2-7BまたはApollo-MoE-0.5Bを例に説明します。 1. プロジェクトのデータセットをダウンロードします。 ``` bash 0.download_data.sh ``` 2. 特定のモデルのテストデータと開発データを準備します。 ``` bash 1.data_process_test&dev.sh ``` 3. 特定のモデルの訓練データを準備します（事前にトークン化されたデータを作成します）。 ``` bash 2.data_process_train.sh ``` 4. モデルを訓練します。 ``` bash 3.single_node_train.sh ``` 5. モデルを評価します。 ``` bash 4.eval.sh ```

🔧 技術詳細

元のモデルは、llama.cpp-b3938を使用して、Exllamav2のキャリブレーションデータセットに基づくimatrixファイルで量子化されています。

2024年12月17日：READMEを更新しました。最近のllama.cppでは、Q4_0_4_4、Q4_0_4_8、Q4_0_8_8のサポートが削除されたようです。これらを保持しますが、もはや有用でない可能性があります。

2025年2月3日：新しいllama.cppバージョンのARMデバイス用に、Q4_0_X_Y量子化の代わりにQ4_0とIQ4_NL量子化を追加しました。

📄 ライセンス

このモデルは、Apache-2.0ライセンスの下で提供されています。

📋 引用

データセットを訓練または評価に使用する場合は、以下の引用を使用してください。

@misc{zheng2024efficientlydemocratizingmedicalllms,
      title={Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts}, 
      author={Guorui Zheng and Xidong Wang and Juhao Liang and Nuo Chen and Yuping Zheng and Benyou Wang},
      year={2024},
      eprint={2410.10626},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2410.10626}, 
}