WizardLM-13B-V1.2オープンソース言語モデル - 無料でデプロイ可能、複雑な指令遵守能力に特化

ホーム

Wizardlm 13B V1.2

WizardLMTeamによって開発

WizardLM-13B V1.2はLlama-2 13bをベースに訓練された大規模言語モデルで、複雑な指令の遵守能力に特化しています。

大規模言語モデル

Transformers

#複雑な指令理解 #数学的推論強化 #コード生成最適化

ダウンロード数 989

リリース時間 : 7/25/2023

モデル概要

このモデルはWizardLMシリーズの一部で、大規模事前学習言語モデルが複雑な指令をより良く理解して実行できるようにすることを目的としています。

モデル特徴

複雑な指令理解

複雑な多段階指令の理解と実行に特化して最適化されています。

高性能

複数のベンチマークテストで優れた結果を示し、同類のオープンソースモデルを上回っています。

Llama-2ベース

強力なLlama-2 13Bモデルをベースに微調整されています。

モデル能力

テキスト生成

指令理解と実行

コード生成

数学問題の解答

複雑なタスクの分解

使用事例

プログラミング支援

コード生成

自然言語の説明に基づいて機能コードを生成します。

HumanEvalベンチマークテストで36.6 pass@1を達成しました。

数学問題の解答

数学的推論

複雑な数学問題を解きます。

GSM8KとMATHベンチマークテストで優れた結果を示しました。

汎用AIアシスタント

多輪対話

複雑な多輪対話とタスクの分解を行います。

AlpacaEvalで89.17%を達成しました。

🚀 WizardLM-13B V1.2 モデル

これはWizardLM-13B V1.2モデルの完全重み付けです。このモデルはLlama-2 13bから訓練されています。

WizardLM: 大規模事前学習言語モデルに複雑な指示に従う能力を付与する

🤗 HFリポジトリ •🐱 GitHubリポジトリ • 🐦 Twitter • 📃 [WizardLM] • 📃 [WizardCoder] • 📃 [WizardMath]

👋 Discordに参加しましょう

ニュース

🔥🔥🔥[2023/08/26] WizardCoder-Python-34B-V1.0をリリースしました。このモデルは73.2 pass@1を達成し、HumanEvalベンチマークでGPT4 (2023/03/15)、ChatGPT-3.5、Claude2を上回りました。詳細はWizardCoderを参照してください。
[2023/06/16] WizardCoder-15B-V1.0をリリースしました。このモデルはHumanEvalベンチマークでClaude-Plus (+6.8)、Bard (+15.3)、**InstructCodeT5+ (+22.3)**を上回りました。詳細はWizardCoderを参照してください。

モデル	チェックポイント	論文	HumanEval	MBPP	デモ	ライセンス
WizardCoder-Python-34B-V1.0	🤗 HFリンク	📃 [WizardCoder]	73.2	61.2	デモ	Llama2
WizardCoder-15B-V1.0	🤗 HFリンク	📃 [WizardCoder]	59.8	50.6	--	OpenRAIL-M
WizardCoder-Python-13B-V1.0	🤗 HFリンク	📃 [WizardCoder]	64.0	55.6	--	Llama2
WizardCoder-Python-7B-V1.0	🤗 HFリンク	📃 [WizardCoder]	55.5	51.6	デモ	Llama2
WizardCoder-3B-V1.0	🤗 HFリンク	📃 [WizardCoder]	34.8	37.4	--	OpenRAIL-M
WizardCoder-1B-V1.0	🤗 HFリンク	📃 [WizardCoder]	23.8	28.6	--	OpenRAIL-M

🔥 [08/11/2023] WizardMathモデルをリリースしました。
🔥 私たちのWizardMath-70B-V1.0モデルは、GSM8KでChatGPT 3.5、Claude Instant 1、PaLM 2 540Bを含むいくつかの閉鎖型LLMを僅差で上回っています。
🔥 私たちのWizardMath-70B-V1.0モデルは、GSM8kベンチマークで81.6 pass@1を達成し、SOTAのオープンソースLLMよりも24.8ポイント高い結果を得ています。
🔥 私たちのWizardMath-70B-V1.0モデルは、MATHベンチマークで22.7 pass@1を達成し、SOTAのオープンソースLLMよりも9.2ポイント高い結果を得ています。

モデル	チェックポイント	論文	GSM8k	MATH	オンラインデモ	ライセンス
WizardMath-70B-V1.0	🤗 HFリンク	📃 [WizardMath]	81.6	22.7	デモ	Llama 2
WizardMath-13B-V1.0	🤗 HFリンク	📃 [WizardMath]	63.9	14.0	デモ	Llama 2
WizardMath-7B-V1.0	🤗 HFリンク	📃 [WizardMath]	54.9	10.7	デモ	Llama 2

モデル	チェックポイント	論文	MT-Bench	AlpacaEval	WizardEval	HumanEval	ライセンス
WizardLM-13B-V1.2	🤗 HFリンク		7.06	89.17%	101.4%	36.6 pass@1	Llama 2ライセンス
WizardLM-13B-V1.1	🤗 HFリンク		6.76	86.32%	99.3%	25.0 pass@1	非商用
WizardLM-30B-V1.0	🤗 HFリンク		7.01		97.8%	37.8 pass@1	非商用
WizardLM-13B-V1.0	🤗 HFリンク		6.35	75.31%	89.1%	24.0 pass@1	非商用
WizardLM-7B-V1.0	🤗 HFリンク	📃 [WizardLM]			78.0%	19.1 pass@1	非商用

リポジトリ: https://github.com/nlpxucan/WizardLM

Twitter:

🔥🔥🔥 [7/25/2023] WizardLM V1.2モデルをリリースしました。WizardLM-13B-V1.2はこちらです (Demo_13B-V1.2, Demo_13B-V1.2_bak-1, 完全モデル重み)。論文をご覧ください。
🔥🔥🔥 [7/25/2023] WizardLM-13B-V1.2はMT-Benchリーダーボードで7.06、AlpacaEvalリーダーボードで89.17%、WizardLM評価で**101.4%**を達成しました。(注: MT-BenchとAlpacaEvalはすべて自己テストであり、更新をプッシュしてレビューを依頼します。すべてのテストは公式設定の下で完了しています。)

❗モデルのシステムプロンプトの使用に関する注意

WizardLMはVicunaのプロンプト形式を採用しており、複数ターンの会話をサポートしています。プロンプトは以下のようにする必要があります。

A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions. USER: Hi ASSISTANT: Hello.</s>USER: Who are you? ASSISTANT: I am WizardLM.</s>......

WizardLMデモスクリプトの推論

推論用のWizardLMデモコードはこちらにあります。

WizardLMのデータやコードを使用する場合は、論文を引用してください。

@article{xu2023wizardlm,
  title={Wizardlm: Empowering large language models to follow complex instructions},
  author={Xu, Can and Sun, Qingfeng and Zheng, Kai and Geng, Xiubo and Zhao, Pu and Feng, Jiazhan and Tao, Chongyang and Jiang, Daxin},
  journal={arXiv preprint arXiv:2304.12244},
  year={2023}
}

❗データセットに関する一般的な懸念

最近、当組織全体のコード、データ、モデルのオープンソースポリシーと規制に明確な変更がありました。

それにもかかわらず、私たちはまだモデルの重みを最初に公開するために努力しましたが、データにはより厳格な審査が必要であり、法務チームによるレビュー中です。

私たちの研究者は、許可なく公開する権限を持っていません。

ご理解いただければ幸いです。