InternLM-7B開源模型 - 基於海量語料構建知識體系，支持工作流靈活定製

首頁

Internlm 7b

由internlm開發

書生·浦語開源了面向實用場景的70億參數基礎模型，基於萬億級高質量語料訓練，構建強大知識體系，並提供多樣化工具集支持用戶靈活定製工作流。

大型語言模型

Transformers

#70億參數大模型 #中文知識增強 #多能力評測領先

下載量 925

發布時間 : 7/6/2023

模型概述

InternLM-7B是一個70億參數規模的大語言模型，專注於實用場景應用，具有強大的知識體系和靈活的定製能力。

模型特點

大規模高質量訓練

基於萬億級高質量語料訓練，構建了強大的知識體系

靈活定製

提供多樣化工具集，支持用戶靈活定製工作流

全面評估

通過OpenCompass從五個維度進行全面評估，性能優異

模型能力

文本生成

知識問答

語言理解

邏輯推理

使用案例

教育

學科知識問答

回答各類學科知識問題

在C-Eval驗證集上達到53.4分

研究

學術研究輔助

幫助研究人員進行文獻綜述和知識整理

商業應用

智能客服

用於構建智能客服系統

🚀 書生·浦語大模型（InternLM）

書生·浦語大模型（InternLM）開源了面向實用場景的70億參數基礎模型。該模型使用上萬億高質量語料進行訓練，建立了強大的知識體系，同時具備通用工具調用能力，支持用戶靈活搭建自己的工作流程。

🚀 快速開始

通過 Transformers 加載

通過以下的代碼加載 InternLM 7B Chat 模型：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("internlm/internlm-7b", trust_remote_code=True)
# `torch_dtype=torch.float16` 可以令模型以 float16 精度加載，否則 transformers 會將模型加載為 float32，有可能導致顯存不足
model = AutoModelForCausalLM.from_pretrained("internlm/internlm-7b", torch_dtype=torch.float16, trust_remote_code=True).cuda()
model = model.eval()
inputs = tokenizer(["來到美麗的大自然，我們發現"], return_tensors="pt")
for k,v in inputs.items():
    inputs[k] = v.cuda()
gen_kwargs = {"max_length": 128, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.1}
output = model.generate(**inputs, **gen_kwargs)
output = tokenizer.decode(output[0].tolist(), skip_special_tokens=True)
print(output)
# 來到美麗的大自然，我們發現各種各樣的花千奇百怪。有的顏色鮮豔亮麗,使人感覺生機勃勃；有的是紅色的花瓣兒粉嫩嫩的像少女害羞的臉龐一樣讓人愛不釋手．有的小巧玲瓏; 還有的花瓣粗大看似枯黃實則暗藏玄機！
# 不同的花卉有不同的“脾氣”,它們都有著屬於自己的故事和人生道理.這些鮮花都是大自然中最為原始的物種,每一朵都綻放出別樣的美令人陶醉、著迷!

✨ 主要特性

使用上萬億高質量語料，建立模型超強知識體系。
具備通用工具調用能力，支持用戶靈活自助搭建流程。

📚 詳細文檔

InternLM-7B 性能評測

我們使用開源評測工具 OpenCompass 從學科綜合能力、語言能力、知識能力、推理能力、理解能力五大能力維度對 InternLM 開展全面評測，部分評測結果如下表所示，歡迎訪問 OpenCompass 榜單獲取更多的評測結果。

數據集\模型	InternLM-Chat-7B	InternLM-7B	LLaMA-7B	Baichuan-7B	ChatGLM2-6B	Alpaca-7B	Vicuna-7B
C-Eval(Val)	53.2	53.4	24.2	42.7	50.9	28.9	31.2
MMLU	50.8	51.0	35.2*	41.5	46.0	39.7	47.3
AGIEval	42.5	37.6	20.8	24.6	39.0	24.1	26.4
CommonSenseQA	75.2	59.5	65.0	58.8	60.0	68.7	66.7
BUSTM	74.3	50.6	48.5	51.3	55.0	48.8	62.5
CLUEWSC	78.6	59.1	50.3	52.8	59.8	50.3	52.2
MATH	6.4	7.1	2.8	3.0	6.6	2.2	2.8
GSM8K	34.5	31.2	10.1	9.7	29.2	6.0	15.3
HumanEval	14.0	10.4	14.0	9.2	9.2	9.2	11.0
RACE(High)	76.3	57.4	46.9*	28.1	66.3	40.7	54.0