h2ogpt - gm - oasst1 - en - 2048 - open - llama - 7b - preview - 700btオープンソース大規模モデル

ホーム

H2ogpt Gm Oasst1 En 2048 Open Llama 7b Preview 700bt

h2oaiによって開発

OpenLlama 7B事前学習モデルを微調整した大規模言語モデルで、OpenAssistantデータセットで訓練され、英語テキスト生成タスクをサポート

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #英語対話生成 #7Bパラメータ規模 #命令微調整モデル

ダウンロード数 58

リリース時間 : 5/24/2023

モデル概要

このモデルはH2O LLM Studioで訓練されたテキスト生成モデルで、OpenLlamaアーキテクチャに基づき、対話や質問応答シーンに適しています

モデル特徴

OpenLlamaアーキテクチャベース

700Bトークンで事前学習されたOpenLlama 7Bモデルをベースとして採用

OpenAssistantデータセットで微調整

高品質なOpenAssistant対話データセットを使用して微調整し、対話能力を最適化

2048トークンのコンテキスト長

最大2048トークンのコンテキストメモリをサポート

モデル能力

テキスト生成

対話システム

質問応答システム

使用事例

対話システム

インテリジェントアシスタント

ユーザーの質問を理解し応答するスマート対話アシスタントの構築

コンテンツ生成

テキスト創作

記事やストーリーなど様々なタイプのテキストコンテンツを生成

🚀 モデルカード

このモデルは、大規模言語モデル（LLM）であり、GPT系の技術を用いて訓練されています。H2O LLM Studioを利用して訓練され、特定のデータセットを基に性能を向上させています。

🚀 クイックスタート

このモデルを使用するには、まず必要なライブラリをインストールする必要があります。GPUを搭載したマシンでtransformersライブラリを使用する場合、transformers、accelerate、torchライブラリをインストールしてください。

✨ 主な機能

多様な自然言語処理タスクに対応しています。
特定のデータセットで訓練されており、質の高い応答を生成します。

📦 インストール

pip install transformers==4.28.1
pip install accelerate==0.18.0
pip install torch==2.0.0

💻 使用例

基本的な使用法

import torch
from transformers import pipeline

generate_text = pipeline(
    model="h2oai/h2ogpt-gm-oasst1-en-2048-open-llama-7b-preview-700bt",
    torch_dtype=torch.float16,
    trust_remote_code=True,
    use_fast=False,
    device_map={"": "cuda:0"},
)

res = generate_text(
    "Why is drinking water so healthy?",
    min_new_tokens=2,
    max_new_tokens=1024,
    do_sample=False,
    num_beams=1,
    temperature=float(0.3),
    repetition_penalty=float(1.2),
    renormalize_logits=True
)
print(res[0]["generated_text"])

高度な使用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "h2oai/h2ogpt-gm-oasst1-en-2048-open-llama-7b-preview-700bt"  # either local folder or huggingface model name
# Important: The prompt needs to be in the same format the model was trained with.
# You can find an example prompt in the experiment logs.
prompt = "<|prompt|>How are you?</s><|answer|>"

tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False)
model = AutoModelForCausalLM.from_pretrained(model_name)
model.cuda().eval()
inputs = tokenizer(prompt, return_tensors="pt", add_special_tokens=False).to("cuda")

# generate configuration can be modified to your needs
tokens = model.generate(
    **inputs,
    min_new_tokens=2,
    max_new_tokens=1024,
    do_sample=False,
    num_beams=1,
    temperature=float(0.3),
    repetition_penalty=float(1.2),
    renormalize_logits=True
)[0]

tokens = tokens[inputs["input_ids"].shape[1]:]
answer = tokenizer.decode(tokens, skip_special_tokens=True)
print(answer)

📚 ドキュメント

概要

このモデルはH2O LLM Studioを使用して訓練されました。

ベースモデル: openlm - research/open_llama_7b_700bt_preview
データセットの準備: OpenAssistant/oasst1

モデルアーキテクチャ

LlamaForCausalLM(
  (model): LlamaModel(
    (embed_tokens): Embedding(32000, 4096, padding_idx=0)
    (layers): ModuleList(
      (0-31): 32 x LlamaDecoderLayer(
        (self_attn): LlamaAttention(
          (q_proj): Linear(in_features=4096, out_features=4096, bias=False)
          (k_proj): Linear(in_features=4096, out_features=4096, bias=False)
          (v_proj): Linear(in_features=4096, out_features=4096, bias=False)
          (o_proj): Linear(in_features=4096, out_features=4096, bias=False)
          (rotary_emb): LlamaRotaryEmbedding()
        )
        (mlp): LlamaMLP(
          (gate_proj): Linear(in_features=4096, out_features=11008, bias=False)
          (down_proj): Linear(in_features=11008, out_features=4096, bias=False)
          (up_proj): Linear(in_features=4096, out_features=11008, bias=False)
          (act_fn): SiLUActivation()
        )
        (input_layernorm): LlamaRMSNorm()
        (post_attention_layernorm): LlamaRMSNorm()
      )
    )
    (norm): LlamaRMSNorm()
  )
  (lm_head): Linear(in_features=4096, out_features=32000, bias=False)
)

モデル構成

このモデルはH2O LLM Studioを使用して訓練され、cfg.yamlの設定を使用しています。独自の大規模言語モデルを訓練する方法については、H2O LLM Studioを参照してください。

モデル検証

EleutherAI lm - evaluation - harnessを使用したモデル検証結果です。

CUDA_VISIBLE_DEVICES=0 python main.py --model hf-causal-experimental --model_args pretrained=h2oai/h2ogpt-gm-oasst1-en-2048-open-llama-7b-preview-700bt --tasks openbookqa,arc_easy,winogrande,hellaswag,arc_challenge,piqa,boolq --device cuda &> eval.log

免責事項

このリポジトリで提供される大規模言語モデルを使用する前に、この免責事項を注意深くお読みください。モデルを使用することは、以下の利用規約に同意することを意味します。

バイアスと不快な内容: 大規模言語モデルは多様なインターネットテキストデータで訓練されており、バイアス、人種差別、不快な内容、またはその他不適切な内容が含まれる場合があります。このモデルを使用することで、生成された内容が時々バイアスを示すか、不快または不適切な内容を生成する可能性があることを認識し、受け入れるものとします。このリポジトリの開発者は、そのような内容や見解を支持、支援、または促進するものではありません。
制限事項: 大規模言語モデルはAIベースのツールであり、人間ではありません。誤った、無意味な、または関係のない応答を生成することがあります。生成された内容を批判的に評価し、裁量で使用するのはユーザーの責任です。
自己責任での使用: この大規模言語モデルのユーザーは、ツールの使用によって生じるすべての結果について完全な責任を負う必要があります。このリポジトリの開発者および貢献者は、提供されたモデルの使用または誤用に起因する損害、損失、または危害について責任を負いません。
倫理的な配慮: ユーザーは、大規模言語モデルを責任を持って、倫理的に使用することが推奨されます。このモデルを使用することで、ハイトスピーチ、差別、嫌がらせ、または違法もしくは有害な活動を促進する目的で使用しないことに同意するものとします。
問題の報告: 大規模言語モデルによって生成されたバイアス、不快、またはその他不適切な内容に遭遇した場合は、提供されたチャネルを通じてリポジトリの管理者に報告してください。あなたのフィードバックはモデルの改善と潜在的な問題の軽減に役立ちます。
免責事項の変更: このリポジトリの開発者は、事前通知なしにこの免責事項を変更または更新する権利を留保します。ユーザーは定期的に免責事項を確認し、変更について最新の情報を得る責任があります。

このリポジトリで提供される大規模言語モデルを使用することで、この免責事項に記載された利用規約を受け入れ、遵守することに同意するものとします。この免責事項のいずれかの部分に同意しない場合は、モデルとそれによって生成された内容の使用を控えてください。