ChemLLM-7B-Chat開源大語言模型 - 免費支持中英文化學與分子科學問答

首頁

Chemllm 7B Chat

由AI4Chem開發

ChemLLM-7B-Chat是首個面向化學與分子科學領域的開源大語言模型，基於InternLM-2架構開發，支持中英文。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #化學專業問答 #分子科學推理 #SMILES解析

下載量 775

發布時間 : 1/15/2024

模型概述

該模型專注於化學與分子科學領域，能夠處理化學相關的文本生成、問答和翻譯任務，特別擅長化學術語和分子結構的處理。

模型特點

化學領域專業化

專門針對化學與分子科學領域優化，能夠處理複雜的化學術語和分子結構。

多語言支持

支持中英文處理，特別適合化學文獻的翻譯和理解。

開源可商用

採用Apache-2.0許可，允許學術研究和商業用途。

分步思考能力

採用分步思考方式解決問題，輸出更結構化和可解釋。

模型能力

化學問答

分子式解析

化學文獻翻譯

化學反應描述

化學知識推理

使用案例

化學教育

化學概念解釋

幫助學生理解複雜的化學概念和反應機理

提供清晰的分步解釋

科研輔助

文獻翻譯

將化學專業文獻在中英文之間轉換

保持專業術語的準確性

藥物研發

分子性質分析

解析藥物分子的結構和性質

提供分子式和結構信息

🚀 ChemLLM-7B-Chat：用於化學和分子科學的大語言模型

ChemLLM-7B-Chat是首個用於化學和分子科學的開源大語言模型，它基於InternLM-2構建。該模型能有效解決化學和分子科學領域的問答、推理等問題，為科研人員和從業者提供專業的語言交互支持。

🚀 快速開始

建議使用新版的ChemLLM！ AI4Chem/ChemLLM-7B-Chat-1.5-DPO 或 AI4Chem/ChemLLM-7B-Chat-1.5-SFT

你可以立即嘗試在線演示，或者按照以下步驟操作：

安裝依賴

安裝 transformers：

pip install transformers

加載並運行 `ChemLLM-7B-Chat`

from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig
import torch

model_name_or_id = "AI4Chem/ChemLLM-7B-Chat"

model = AutoModelForCausalLM.from_pretrained(model_name_or_id, torch_dtype=torch.float16, device_map="auto",trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_name_or_id,trust_remote_code=True)

prompt = "What is Molecule of Ibuprofen?"

inputs = tokenizer(prompt, return_tensors="pt").to("cuda")

generation_config = GenerationConfig(
    do_sample=True,
    top_k=1,
    temperature=0.9,
    max_new_tokens=500,
    repetition_penalty=1.5,
    pad_token_id=tokenizer.eos_token_id
)

outputs = model.generate(**inputs, generation_config=generation_config)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

✨ 主要特性

系統提示最佳實踐

你可以使用來自Agent Chepybara的相同對話模板和系統提示，以在本地推理中獲得更好的響應。

對話模板

對於ShareGPT格式的查詢，例如：

{'instruction': "...", "prompt": "...", "answer": "...", "history": [[q1, a1], [q2, a2]]}

你可以將其格式化為InternLM2對話格式，如下所示：

def InternLM2_format(instruction, prompt, answer, history):
    prefix_template = [
        "<|im_start|>system\n",
        "{}",
        "<|im_end|>\n"
    ]
    prompt_template = [
        "<|im_start|>user\n",
        "{}",
        "<|im_end|>\n"
        "<|im_start|>assistant\n",
        "{}",
        "<|im_end|>\n"
    ]
    system = f'{prefix_template[0]}{prefix_template[1].format(instruction)}{prefix_template[2]}'
    history = "".join([f'{prompt_template[0]}{prompt_template[1].format(qa[0])}{prompt_template[2]}{prompt_template[3]}{prompt_template[4].format(qa[1])}{prompt_template[5]}' for qa in history])
    prompt = f'{prompt_template[0]}{prompt_template[1].format(prompt)}{prompt_template[2]}{prompt_template[3]}'
    return f"{system}{history}{prompt}"

系統提示示例

- Chepybara是由上海人工智能實驗室（上海人工智能實驗室）開發的對話式語言模型。它旨在專業、精細且以化學為中心。 
- 對於不確定的概念和數據，Chepybara總是進行理論預測並告知用戶。
- Chepybara可以接受SMILES（簡化分子線性輸入規範）字符串，並傾向於輸出IUPAC名稱（國際純粹與應用化學聯合會有機化學命名法），用SMARTS（SMILES任意目標規範）字符串描述反應。也接受Self-Referencing Embedded Strings（SELFIES）。
- Chepybara總是以逐步的方式解決問題和思考，輸出以“讓我們逐步思考”開頭。

評測結果

MMLU評測亮點

數據集	ChatGLM3 - 6B	Qwen - 7B	LLaMA - 2 - 7B	Mistral - 7B	InternLM2 - 7B - Chat	ChemLLM - 7B - Chat
大學化學	43.0	39.0	27.0	40.0	43.0	47.0
大學數學	28.0	33.0	33.0	30.0	36.0	41.0
大學物理	32.4	35.3	25.5	34.3	41.2	48.0
形式邏輯	35.7	43.7	24.6	40.5	34.9	47.6
道德場景	26.4	35.0	24.1	39.9	38.6	44.3
人文學科平均分	62.7	62.5	51.7	64.5	66.5	68.6
STEM學科平均分	46.5	45.8	39.0	47.8	52.2	52.6
社會科學平均分	68.2	65.8	55.5	68.1	69.7	71.9
其他平均分	60.5	60.3	51.3	62.4	63.2	65.2
MMLU總分	58.0	57.1	48.2	59.2	61.7	63.2
*(OpenCompass)

MMLU評測結果

化學基準測試

化學基準測試結果 *（由ChatGPT - 4 - turbo評判得分）

專業翻譯

專業翻譯示例1 專業翻譯示例2

你可以在在線演示中嘗試。

📚 詳細文檔

引用此工作

@misc{zhang2024chemllm,
      title={ChemLLM: A Chemical Large Language Model}, 
      author={Di Zhang and Wei Liu and Qian Tan and Jingdan Chen and Hang Yan and Yuliang Yan and Jiatong Li and Weiran Huang and Xiangyu Yue and Dongzhan Zhou and Shufei Zhang and Mao Su and Hansen Zhong and Yuqiang Li and Wanli Ouyang},
      year={2024},
      eprint={2402.06852},
      archivePrefix={arXiv},
      primaryClass={cs.AI}
}