llama2_7b_mmluオープンソースAIモデル - MMLU指標を向上させ、他の指標の安定性を維持

ホーム

Llama2 7b Mmlu

itsliupengによって開発

Llama-2-7b-hfモデルをMMLUデータセットで継続的に学習させ、MMLU指標の性能を向上させると同時に、他の指標を安定させます。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #MMLU性能最適化 #多タスクテキスト生成 #低リソースでの効率的な推論

ダウンロード数 120

リリース時間 : 10/10/2023

モデル概要

このモデルはLlama-2-7b-hfの改良版で、mmlu_recallデータセットを使って継続的に学習させ、MMLUベンチマークテストでの性能向上に特化し、他の能力指標に影響を与えないようにしています。

モデル特徴

MMLU性能向上

mmlu_recallデータセットで継続的に学習させることで、MMLU指標が60.04に達し、オリジナル版と比べて大幅な向上が見られます。

多タスク能力の維持

MMLUの性能を向上させると同時に、ARC、HellaSwagなどの他のベンチマークテストの安定した性能を維持しています。

オープンソースライセンス

Apache-2.0ライセンスを採用しており、商用および研究用途での使用が許可されています。

モデル能力

テキスト生成

知識問答

言語理解

推論能力

使用事例

教育

学術問答システム

様々な学術的な質問に答えるために使用され、特に幅広い知識が必要な質問に対応します。

MMLUベンチマークテストで優れた成績を収めています。

研究

モデル性能研究

継続的な学習が特定の指標に与える影響を研究します。

特定の指標を向上させる一方で、他の能力に影響を与えないことが実現されました。

メトリクス	値
平均	46.31
ARC (25-shot)	56.14
HellaSwag (10-shot)	79.13
MMLU (5-shot)	60.04
TruthfulQA (0-shot)	40.95
Winogrande (5-shot)	74.43
GSM8K (5-shot)	7.88
DROP (3-shot)	5.59

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Llama2 7b Mmlu

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Llama-2-7b-hfのmmlu_recallデータセットによる学習

🚀 クイックスタート

📄 ライセンス