MiniCPM3-4BオープンソースAIモデル - 性能はPhi - 3.5などを上回り、7B

Minicpm3 4B

openbmbによって開発

MiniCPM3-4BはMiniCPMシリーズの第3世代モデルで、全体的な性能がPhi-3.5-mini-InstructとGPT-3.5-Turbo-0125を上回り、最近の複数の7B～9B規模のモデルと同等のパフォーマンスを発揮します。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #中日バイリンガル最適化 #関数呼び出しサポート #長文処理

ダウンロード数 15.94k

リリース時間 : 9/3/2024

モデル概要

MiniCPM3-4Bは、汎用シーンでの応用を実現するためのより強力な多次元能力を備えており、関数呼び出しやコードインタプリタ機能をサポートし、32kのコンテキストウィンドウを持ちます。LLMxMapReduce技術と組み合わせることで、理論的には無限の長文を処理でき、大量のメモリを消費しません。

モデル特徴

高性能

全体的な性能がPhi-3.5-mini-InstructとGPT-3.5-Turbo-0125を上回り、最近の複数の7B～9B規模のモデルと同等のパフォーマンスを発揮します。

多機能サポート

関数呼び出しやコードインタプリタ機能をサポートし、汎用シーンでの応用を実現するためのより強力な多次元能力を備えています。

長文処理

32kのコンテキストウィンドウを持ち、LLMxMapReduce技術と組み合わせることで、理論的には無限の長文を処理でき、大量のメモリを消費しません。

モデル能力

テキスト生成

関数呼び出し

コード解釈

長文処理

多言語サポート

使用事例

汎用QA

旅行推薦

ユーザーに観光スポットを推薦する

ユーザーのニーズに合った観光スポットの推薦リストを生成できる

プログラミング支援

コード生成

要件に基づいてコードスニペットを生成する

HumanEval+テストで68.3点を獲得

数学問題解答

数学計算

様々な数学問題を解決する

GSM8Kテストで81.1点を獲得

🚀 MiniCPM3-4B

MiniCPM3-4BはMiniCPMシリーズの第3世代モデルです。全体的な性能はPhi-3.5-mini-InstructやGPT-3.5-Turbo-0125を上回り、多くの最近の7B～9Bモデルと匹敵します。

MiniCPMリポジトリ | MiniCPM論文 | MiniCPM-Vリポジトリ | Discord と WeChat で私たちに参加しましょう

🚀 クイックスタート

概要

MiniCPM3-4BはMiniCPMシリーズの第3世代で、全体的な性能がPhi-3.5-mini-InstructやGPT-3.5-Turbo-0125を上回り、多くの最近の7B~9Bモデルと匹敵します。MiniCPM1.0/MiniCPM2.0と比較して、MiniCPM3-4Bはより強力で汎用的な機能を備えており、関数呼び出しやコードインタープリターをサポートしています。また、32kのコンテキストウィンドウを持ち、LLMxMapReduceを搭載することで、理論的に無限のコンテキストを処理でき、大量のメモリを必要としません。

✨ 主な機能

高性能：全体的な性能がPhi-3.5-mini-InstructやGPT-3.5-Turbo-0125を上回り、多くの最近の7B~9Bモデルと匹敵します。
汎用性：MiniCPM1.0/MiniCPM2.0と比較して、より強力で汎用的な機能を備えています。
関数呼び出しとコードインタープリター：関数呼び出しとコードインタープリターをサポートしています。
大規模コンテキスト処理：32kのコンテキストウィンドウを持ち、LLMxMapReduceを搭載することで、理論的に無限のコンテキストを処理できます。

📦 インストール

vLLMを使用する場合

現時点では、forkしたvLLMのバージョンをインストールする必要があります。

pip install git+https://github.com/OpenBMB/vllm.git@minicpm3

💻 使用例

基本的な使用法

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

path = "openbmb/MiniCPM3-4B"
device = "cuda"

tokenizer = AutoTokenizer.from_pretrained(path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(path, torch_dtype=torch.bfloat16, device_map=device, trust_remote_code=True)

messages = [
    {"role": "user", "content": "推荐5个北京的景点。"},
]
model_inputs = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True).to(device)

model_outputs = model.generate(
    model_inputs,
    max_new_tokens=1024,
    top_p=0.7,
    temperature=0.7
)

output_token_ids = [
    model_outputs[i][len(model_inputs[i]):] for i in range(len(model_inputs))
]

responses = tokenizer.batch_decode(output_token_ids, skip_special_tokens=True)[0]
print(responses)

高度な使用法

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams

model_name = "openbmb/MiniCPM3-4B"
prompt = [{"role": "user", "content": "推荐5个北京的景点。"}]

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
input_text = tokenizer.apply_chat_template(prompt, tokenize=False, add_generation_prompt=True)

llm = LLM(
    model=model_name,
    trust_remote_code=True,
    tensor_parallel_size=1
)
sampling_params = SamplingParams(top_p=0.7, temperature=0.7, max_tokens=1024, repetition_penalty=1.02)

outputs = llm.generate(prompts=input_text, sampling_params=sampling_params)

print(outputs[0].outputs[0].text)

📚 ドキュメント

評価結果

ベンチマーク	Qwen2-7B-Instruct	GLM-4-9B-Chat	Gemma2-9B-it	Llama3.1-8B-Instruct	GPT-3.5-Turbo-0125	Phi-3.5-mini-Instruct(3.8B)	MiniCPM3-4B
英語
MMLU	70.5	72.4	72.6	69.4	69.2	68.4	67.2
BBH	64.9	76.3	65.2	67.8	70.3	68.6	70.2
MT-Bench	8.41	8.35	7.88	8.28	8.17	8.60	8.41
IFEVAL (Prompt Strict-Acc.)	51.0	64.5	71.9	71.5	58.8	49.4	68.4
中国語
CMMLU	80.9	71.5	59.5	55.8	54.5	46.9	73.3
CEVAL	77.2	75.6	56.7	55.2	52.8	46.1	73.6
AlignBench v1.1	7.10	6.61	7.10	5.68	5.82	5.73	6.74
FollowBench-zh (SSR)	63.0	56.4	57.0	50.6	64.6	58.1	66.8
数学
MATH	49.6	50.6	46.0	51.9	41.8	46.4	46.6
GSM8K	82.3	79.6	79.7	84.5	76.4	82.7	81.1
MathBench	63.4	59.4	45.8	54.3	48.9	54.9	65.6
コード
HumanEval+	70.1	67.1	61.6	62.8	66.5	68.9	68.3
MBPP+	57.1	62.2	64.3	55.3	71.4	55.8	63.2
LiveCodeBench v3	22.2	20.2	19.2	20.4	24.0	19.6	22.6
関数呼び出し
BFCL v2	71.6	70.1	19.2	73.3	75.4	48.4	76.0
全体
平均	65.3	65.0	57.9	60.8	61.0	57.2	66.3

声明

MiniCPM3-4Bは言語モデルであり、大量のテキストを学習することでコンテンツを生成します。
しかし、理解や個人的な意見や価値判断を表現する能力は持っていません。
MiniCPM3-4Bが生成するコンテンツは、モデル開発者の見解や立場を表すものではありません。
したがって、MiniCPM3-4Bが生成するコンテンツを使用する際には、ユーザー自身が評価と検証の責任を負う必要があります。

📄 ライセンス

このリポジトリはApache-2.0ライセンスの下で公開されています。
MiniCPM3-4Bモデルの重みの使用は、MiniCPM Model License.mdに厳密に従う必要があります。
MiniCPM3-4Bのモデルと重みは、学術研究には完全に無料で利用できます。また、"アンケート"に登録することで、商用利用も無料で可能です。

引用

@article{hu2024minicpm,
  title={MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies},
  author={Hu, Shengding and Tu, Yuge and Han, Xu and He, Chaoqun and Cui, Ganqu and Long, Xiang and Zheng, Zhi and Fang, Yewei and Huang, Yuxiang and Zhao, Weilin and others},
  journal={arXiv preprint arXiv:2404.06395},
  year={2024}
}