SOLAR-0-70b-16bitオープンソース大規模言語モデル - 長文本文処理を無料でサポート、ランキングで良好な成績

ホーム

SOLAR 0 70b 16bit

upstageによって開発

UpstageがLLaMA-2を基に微調整した大規模言語モデルで、HuggingFaceのオープン大規模言語モデルランキングで優れた性能を発揮し、長文処理をサポート

大規模言語モデル

Transformers

英語#70B大規模パラメータ #超長文処理 #命令微調整最適化

ダウンロード数 2,943

リリース時間 : 7/30/2023

モデル概要

LLaMA-2アーキテクチャを基にした700億パラメータの大規模言語モデルで、命令微調整により最適化され、自然言語テキストの理解と生成に優れる

モデル特徴

長文処理能力

rope_scaling技術により10kトークンを超える長文入力処理をサポート

高性能

HuggingFaceオープン大規模言語モデルランキングでトップクラスの成績を達成

命令最適化

OrcaとAlpacaスタイルのデータセットで微調整され、命令追従に優れる

モデル能力

テキスト生成

命令理解

質問応答システム

長文処理

使用事例

インテリジェントアシスタント

質問応答システム

ユーザーの様々な質問に回答

正確で詳細な回答を提供可能

コンテンツ生成

プロンプトに基づき一貫性のあるテキストを生成

流暢で文脈に合ったテキストを生成

企業アプリケーション

ドキュメント処理

長文ドキュメントの処理と分析

長文ドキュメントのキー情報を理解し要約可能

🚀 SOLAR-0-70b-16bitモデル

Upstageによって開発された新しいボット「Solar」が、Poeで利用可能になりました。HuggingFace Open LLMリーダーボードで上位にランクインしており、Llama 2をファインチューニングしたSolarは、オープンソースによって可能になった進歩の素晴らしい例です。 https://poe.com/Solar-0-70b で今すぐ試してみてください。

🚀 クイックスタート

モデル名は、LLaMa - 2 - 70b - instruct - v2からSOLAR - 0 - 70b - 16bitに変更されました。

✨ 主な機能

このモデルは、LLaMA - 2をベースにしており、HuggingFace Transformersライブラリを使用して開発されています。また、最大10k以上の入力トークンを処理することができます。

📦 インストール

以下のコードを使用して、モデルをロードすることができます。これはA100 80GBでテストされています。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

tokenizer = AutoTokenizer.from_pretrained("upstage/Llama-2-70b-instruct-v2")
model = AutoModelForCausalLM.from_pretrained(
    "upstage/Llama-2-70b-instruct-v2",
    device_map="auto",
    torch_dtype=torch.float16,
    load_in_8bit=True,
    rope_scaling={"type": "dynamic", "factor": 2} # allows handling of longer inputs
)

prompt = "### User:\nThomas is healthy, but he has to go to the hospital. What could be the reasons?\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
del inputs["token_type_ids"]
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)

output = model.generate(**inputs, streamer=streamer, use_cache=True, max_new_tokens=float('inf'))
output_text = tokenizer.decode(output[0], skip_special_tokens=True)

📚 ドキュメント

モデル詳細

属性	詳情
開発元	Upstage
バックボーンモデル	LLaMA - 2
言語	英語
ライブラリ	HuggingFace Transformers
ライセンス	ファインチューニングされたチェックポイントは、非商用のCreative Commonsライセンス（CC BY - NC - 4.0）の下でライセンスされています。
コメント送信先	モデルに関するフィードバックやコメントを提供する方法についての説明は、Hugging Faceコミュニティのモデルリポジトリで問題を開くことで確認できます。
問い合わせ先	モデルに関する質問やコメントは、contact@upstage.aiまでメールしてください。

データセット詳細

使用データセット

Orcaスタイルのデータセット
Alpacaスタイルのデータセット
上記のデータセット以外は使用されていません。
ベンチマークテストセットやトレーニングセットは使用されていません。

プロンプトテンプレート

### System:
{System}

### User:
{User}

### Assistant:
{Assistant}

ハードウェアとソフトウェア

ハードウェア：このモデルのトレーニングには、A100x8 * 4を使用しました。
トレーニング要素：このモデルは、DeepSpeedライブラリとHuggingFace Trainer / HuggingFace Accelerateを組み合わせてファインチューニングされています。

評価結果

概要

Open LLM Leaderboardで評価されているタスクに従って、パフォーマンス評価を行いました。
モデルは、ARC - Challenge、HellaSwag、MMLU、TruthfulQAの4つのベンチマークデータセットで評価されました。
lm - evaluation - harnessリポジトリ、具体的にはコミットb281b0921b636bc36ad05c0b0b0763bd6dd43463を使用しました。
MT - benchという、難しいマルチターンのオープンエンド型の質問セットを使用して、モデルを評価しました。

主要結果

モデル	H4(平均)	ARC	HellaSwag	MMLU	TruthfulQA	MT_Bench
Llama - 2 - 70b - instruct - v2(当社のモデル, Open LLM Leaderboard)	73	71.1	87.9	70.6	62.2	7.44063
Llama - 2 - 70b - instruct (当社のモデル, Open LLM Leaderboard)	72.3	70.9	87.5	69.8	61	7.24375
llama - 65b - instruct (当社のモデル, Open LLM Leaderboard)	69.4	67.6	86.5	64.9	58.8
Llama - 2 - 70b - hf	67.3	67.3	87.3	69.8	44.9
llama - 30b - instruct - 2048 (当社のモデル, Open LLM Leaderboard)	67.0	64.9	84.9	61.9	56.3
llama - 30b - instruct (当社のモデル, Open LLM Leaderboard)	65.2	62.5	86.2	59.4	52.8
llama - 65b	64.2	63.5	86.1	63.9	43.4
falcon - 40b - instruct	63.4	61.6	84.3	55.4	52.5

H4スコア再現用スクリプト

評価環境を準備するには、以下のコマンドを実行します。

# リポジトリをクローンする
git clone https://github.com/EleutherAI/lm-evaluation-harness.git
# 特定のコミットにチェックアウトする
git checkout b281b0921b636bc36ad05c0b0b0763bd6dd43463
# リポジトリディレクトリに移動する
cd lm-evaluation-harness

📄 ライセンス

ファインチューニングされたチェックポイントは、非商用のCreative Commonsライセンス（CC BY - NC - 4.0）の下でライセンスされています。

🔧 技術詳細

このモデルは、LLaMA - 2をベースにしており、rope_scalingオプションを使用することで、最大10k以上の入力トークンを処理することができます。トレーニングには、A100x8 * 4のハードウェアを使用し、DeepSpeedライブラリとHuggingFace Trainer / HuggingFace Accelerateを組み合わせてファインチューニングされています。

お問い合わせ

Upstageについて

Upstageは、大規模言語モデル（LLM）とAIに特化した会社です。当社は、あなたがプライベートなLLMと関連アプリケーションを構築するのを支援します。ドメイン固有のLLMを構築するためのデータセットがある場合、またはLLMアプリケーションを作成する場合は、► ここをクリックしてお問い合わせください。
8月1日現在、当社の70BモデルはopenLLMランキングでトップにランクインしており、現在世界で最も優れたパフォーマンスを誇っています。