InternLM-7B开源模型 - 基于海量语料构建知识体系，支持工作流灵活定制

首页

Internlm 7b

由 internlm 开发

书生·浦语开源了面向实用场景的70亿参数基础模型，基于万亿级高质量语料训练，构建强大知识体系，并提供多样化工具集支持用户灵活定制工作流。

大型语言模型

Transformers

#70亿参数大模型 #中文知识增强 #多能力评测领先

下载量 925

发布时间 : 7/6/2023

模型简介

InternLM-7B是一个70亿参数规模的大语言模型，专注于实用场景应用，具有强大的知识体系和灵活的定制能力。

模型特点

大规模高质量训练

基于万亿级高质量语料训练，构建了强大的知识体系

灵活定制

提供多样化工具集，支持用户灵活定制工作流

全面评估

通过OpenCompass从五个维度进行全面评估，性能优异

模型能力

文本生成

知识问答

语言理解

逻辑推理

使用案例

教育

学科知识问答

回答各类学科知识问题

在C-Eval验证集上达到53.4分

研究

学术研究辅助

帮助研究人员进行文献综述和知识整理

商业应用

智能客服

用于构建智能客服系统

🚀 书生·浦语大模型（InternLM）

书生·浦语大模型（InternLM）开源了面向实用场景的70亿参数基础模型。该模型使用上万亿高质量语料进行训练，建立了强大的知识体系，同时具备通用工具调用能力，支持用户灵活搭建自己的工作流程。

🚀 快速开始

通过 Transformers 加载

通过以下的代码加载 InternLM 7B Chat 模型：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("internlm/internlm-7b", trust_remote_code=True)
# `torch_dtype=torch.float16` 可以令模型以 float16 精度加载，否则 transformers 会将模型加载为 float32，有可能导致显存不足
model = AutoModelForCausalLM.from_pretrained("internlm/internlm-7b", torch_dtype=torch.float16, trust_remote_code=True).cuda()
model = model.eval()
inputs = tokenizer(["来到美丽的大自然，我们发现"], return_tensors="pt")
for k,v in inputs.items():
    inputs[k] = v.cuda()
gen_kwargs = {"max_length": 128, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.1}
output = model.generate(**inputs, **gen_kwargs)
output = tokenizer.decode(output[0].tolist(), skip_special_tokens=True)
print(output)
# 来到美丽的大自然，我们发现各种各样的花千奇百怪。有的颜色鲜艳亮丽,使人感觉生机勃勃；有的是红色的花瓣儿粉嫩嫩的像少女害羞的脸庞一样让人爱不释手．有的小巧玲珑; 还有的花瓣粗大看似枯黄实则暗藏玄机！
# 不同的花卉有不同的“脾气”,它们都有着属于自己的故事和人生道理.这些鲜花都是大自然中最为原始的物种,每一朵都绽放出别样的美令人陶醉、着迷!

✨ 主要特性

使用上万亿高质量语料，建立模型超强知识体系。
具备通用工具调用能力，支持用户灵活自助搭建流程。

📚 详细文档

InternLM-7B 性能评测

我们使用开源评测工具 OpenCompass 从学科综合能力、语言能力、知识能力、推理能力、理解能力五大能力维度对 InternLM 开展全面评测，部分评测结果如下表所示，欢迎访问 OpenCompass 榜单获取更多的评测结果。

数据集\模型	InternLM-Chat-7B	InternLM-7B	LLaMA-7B	Baichuan-7B	ChatGLM2-6B	Alpaca-7B	Vicuna-7B
C-Eval(Val)	53.2	53.4	24.2	42.7	50.9	28.9	31.2
MMLU	50.8	51.0	35.2*	41.5	46.0	39.7	47.3
AGIEval	42.5	37.6	20.8	24.6	39.0	24.1	26.4
CommonSenseQA	75.2	59.5	65.0	58.8	60.0	68.7	66.7
BUSTM	74.3	50.6	48.5	51.3	55.0	48.8	62.5
CLUEWSC	78.6	59.1	50.3	52.8	59.8	50.3	52.2
MATH	6.4	7.1	2.8	3.0	6.6	2.2	2.8
GSM8K	34.5	31.2	10.1	9.7	29.2	6.0	15.3
HumanEval	14.0	10.4	14.0	9.2	9.2	9.2	11.0
RACE(High)	76.3	57.4	46.9*	28.1	66.3	40.7	54.0