AceInstruct-7BオープンソースAIモデル - 無料でデプロイ可能で、コーディング、数学、一般的なタスクに利用可能

ホーム

Aceinstruct 7B

nvidiaによって開発

AceInstruct-7BはQwen2.5-Baseをベースに改良された先進的なSFTモデルで、コーディング、数学、汎用タスクに適しています。

大規模言語モデル

Safetensors

#多領域SFT微調整 #コーディングと数学の汎用性 #Qwen改良アーキテクチャ

ダウンロード数 1,450

リリース時間 : 1/15/2025

モデル概要

AceInstruct-7Bは多領域に対応した命令微調整モデルで、コーディング、数学、汎用知識タスクで優れた性能を発揮します。

モデル特徴

多領域適用性

コーディング、数学、汎用タスクに使用でき、幅広い応用範囲を持っています。

性能卓越

ベンチマーク評価で優れた結果を示し、一部の指標でQwen2.5-Instructを上回っています。

改良アーキテクチャ

Qwenをベースに改良され、汎用SFTデータセットで微調整されています。

モデル能力

コード生成

数学推論

汎用知識質問応答

テキスト生成

使用事例

プログラミング

コード生成

自然言語の説明に基づいてコードを生成します。

HumanEvalベンチマークテストで85.37点を獲得しました。

コード補完

開発者がコード断片を完成させるのを支援します。

数学

数学問題解決

様々な数学問題を解きます。

GSM8Kベンチマークテストで93.10点を獲得しました。

数学推論

複雑な数学推論を行います。

MATHベンチマークテストで76.40点を獲得しました。

汎用知識

質問応答システム

様々な知識性の質問に答えます。

MMLUベンチマークテストで74.68点を獲得しました。

コンテンツ生成

様々なテキストコンテンツを生成します。

🚀 AceInstruct

AceInstructは、コーディング、数学、一般的なタスクに対応した高度なSFTモデルのファミリーです。Qwenを用いて改善されており、幅広いドメインでの使用が可能で、Qwen2.5-Instructと同等の性能を発揮します。

🚀 クイックスタート

AceInstructは、コーディング、数学、一般知識のタスクに対応した高度なSFTモデルのファミリーです。AceInstructファミリーには、AceInstruct-1.5B、7B、72Bが含まれており、Qwenを用いて改善されています。

これらのモデルは、一般的なSFTデータセットを使用してQwen2.5-Base上で微調整されています。同じデータセットは、AceMath-Instructのトレーニングにも使用されています。数学の質問に特化したAceMath-Instructとは異なり、AceInstructは汎用的で、幅広いドメインに適用できます。コーディング、数学、一般知識のタスクにわたるベンチマーク評価により、AceInstructはQwen2.5-Instructと同等の性能を発揮することが示されています。

AceInstructの詳細については、ウェブサイトと論文をご確認ください。

✨ 主な機能

ベンチマーク結果

	Qwen2.5-1.5B-Instruct	AceInstruct-1.5B	Qwen2.5-7B-Instruct	AceInstruct-7B	Qwen2.5-72B-Instruct	AceInstruct-72B
HumanEval	61.60	73.17	84.80	85.37	86.60	89.63
MBPP	63.20	65.76	79.20	74.32	88.20	83.66
GSM8K	73.20	80.44	91.60	93.10	95.80	96.36
MATH	55.20	60.34	75.50	76.40	83.10	84.50
MMLU	58.37	58.17	74.51	74.68	84.67	83.88
MMLU Pro	32.40	33.78	56.30	54.50	71.10	66.10
Average	57.33	61.94	76.99	76.40	84.91	84.02

コーディング、数学、一般知識のタスクにわたってAceInstructをQwen2.5-Instructと比較しました。AceInstruct-1.5BはQwen2.5-1.5B-Instructを上回っており（61.94対57.33）、AceInstruct-7BとAceInstruct-72BはQwen2.5-7B-InstructとQwen2.5-72B-Instructと同様の性能を発揮しています。

すべてのリソース

AceMath命令モデル

AceMath報酬モデル

評価とトレーニングデータ

一般的な命令モデル

💻 使用例

基本的な使用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "AceInstruct-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")

prompt = "Tell me something about artificial intelligence."
messages = [{"role": "user", "content": prompt}]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to("cuda")

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=1024
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

📚 ドキュメント

担当者

Zihan Liu (zihanl@nvidia.com)、Yang Chen (yachen@nvidia.com)、Wei Ping (wping@nvidia.com)

引用

もし私たちの研究が役に立った場合は、引用していただけると幸いです。

@article{acemath2024,
  title={AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling},
  author={Liu, Zihan and Chen, Yang and Shoeybi, Mohammad and Catanzaro, Bryan and Ping, Wei},
  journal={arXiv preprint},
  year={2024}
}

📄 ライセンス

AceInstructファミリーのすべてのモデルは、OpenAIによって生成されたデータの利用規約に従い、非商用利用のみに許可されています。AceInstructモデルは、Creative Commons Attribution: Non-Commercial 4.0 Internationalのライセンスの下に置かれています。