Llama-3-Instruct-8Bオープンソース言語モデル - 無料デプロイによる効率的なテキスト生成の支援

ホーム

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

grimjimによって開発

これはMeta Llama 3をベースに構築された統合事前学習言語モデルで、SimPOとSPPO-Iter3の2つのモデルの長所を組み合わせ、テキスト生成タスクに適しています。

大規模言語モデル

Transformers

#指令微調最適化 #SLERP混合モデル #多タスクテキスト生成

ダウンロード数 8,305

リリース時間 : 6/28/2024

モデル概要

このモデルはprinceton - nlp/Llama-3-Instruct-8B-SimPOとUCLA - AGI/Llama-3-Instruct-8B-SPPO-Iter3の2つの事前学習言語モデルを統合して得られ、SLERP統合方法を使用し、テキスト生成性能の向上を目指しています。

モデル特徴

モデル統合技術

SLERP統合方法を使用してSimPOとSPPO-Iter3の2つのモデルの長所を組み合わせます

効率的なテキスト生成

指令追従と高品質なテキスト生成能力に特化しています

パラメータ最適化

異なる最適化方法のモデルを統合することで、全体的な性能を向上させます

モデル能力

テキスト生成

指令追従

自然言語理解

使用事例

テキスト生成

指令応答生成

ユーザーの指令に基づいて適切なテキスト応答を生成します

IFEvalベンチマークテストで68.06点を達成しました

質問応答システム

ユーザーが提出した様々な質問に回答します

BBHベンチマークテストで29.07点を達成しました

教育

数学問題の解決

数学問題を解きます

MATH Lvl 5ベンチマークテストで6.19点を達成しました

メトリック	値
平均	23.59
IFEval (0-Shot)	68.06
BBH (3-Shot)	29.07
MATH Lvl 5 (4-Shot)	6.19
GPQA (0-shot)	1.68
MuSR (0-shot)	6.70
MMLU-PRO (5-shot)	29.83

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Llama-3-Instruct-8B-SimPO-SPPO-Iter3-merge

🚀 クイックスタート

✨ 主な機能

📦 インストール

📚 ドキュメント

マージの詳細

マージ方法

マージされたモデル

設定

Open LLM Leaderboard評価結果

📄 ライセンス