mamba-2.8b-instruct-openhermesオープンソースモデル - さまざまなテキスト生成タスクを効率的に完了

ホーム

Mamba 2.8b Instruct Openhermes

clibrainによって開発

これはOpenHermesデータセットで微調整された28億パラメータのMAMBAモデルで、新しい状態空間アーキテクチャを採用し、テキスト生成タスクに優れています。

大規模言語モデル

Transformers

英語#命令微調整モデル #状態空間アーキテクチャ #多分野命令応答

ダウンロード数 202

リリース時間 : 12/12/2023

モデル概要

このモデルはMAMBAアーキテクチャに基づく命令微調整モデルで、テキスト生成タスクに特化して最適化されており、OpenHermesデータセットを使用してトレーニングされています。

モデル特徴

効率的なアーキテクチャ

MAMBA状態空間モデルアーキテクチャを採用しており、従来のTransformerと比較してより高い計算効率を実現

高品質なトレーニングデータ

OpenHermesデータセットを使用しており、24.2万件のGPT-4生成の高品質命令データを含む

オープンソースライセンス

WTFPLライセンスを採用しており、自由な使用と改変が許可されている

モデル能力

テキスト生成

命令追従

対話生成

使用事例

旅行推薦

観光スポット推薦

ユーザーのリクエストに基づいて観光スポットを推薦

5つの観光スポットを含む詳細な推薦リストを生成可能

一般的な質問応答

知識質問応答

ユーザーが提出する様々な知識質問に回答

正確で詳細な回答を提供可能

🚀 MAMBA (2.8B) 🐍 OpenHermesでファインチューニング済み

モデルカードはまだ作成中です！

🚀 クイックスタート

このモデルを使用するには、まず必要なライブラリをインストールします。

pip install torch==2.1.0 transformers==4.35.0 causal-conv1d==1.0.0 mamba-ssm==1.0.1

以下のPythonコードでモデルを使用できます。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
from mamba_ssm.models.mixer_seq_simple import MambaLMHeadModel

CHAT_TEMPLATE_ID = "HuggingFaceH4/zephyr-7b-beta"

device = "cuda:0" if torch.cuda.is_available() else "cpu"
model_name = "clibrain/mamba-2.8b-instruct-openhermes"

eos_token = "<|endoftext|>"
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.eos_token = eos_token
tokenizer.pad_token = tokenizer.eos_token
tokenizer.chat_template = AutoTokenizer.from_pretrained(CHAT_TEMPLATE_ID).chat_template

model = MambaLMHeadModel.from_pretrained(
        model_name, device=device, dtype=torch.float16)

messages = []
prompt = "Tell me 5 sites to visit in Spain"
messages.append(dict(role="user", content=prompt))

input_ids = tokenizer.apply_chat_template(
            messages, return_tensors="pt", add_generation_prompt=True
).to(device)

out = model.generate(
    input_ids=input_ids,
    max_length=2000,
    temperature=0.9,
    top_p=0.7,
    eos_token_id=tokenizer.eos_token_id,
)

decoded = tokenizer.batch_decode(out)
assistant_message = (
    decoded[0].split("<|assistant|>\n")[-1].replace(eos_token, "")
)

print(assistant_message)

Gradioデモの実行方法

以下のコマンドを実行して、Gradioデモを起動できます。

git clone https://github.com/mrm8488/mamba-chat.git
cd mamba-chat

pip install -r requirements.txt
pip install -q gradio==4.8.0

python app.py \
--model clibrain/mamba-2.8b-instruct-openhermes \
--share

✨ 主な機能

Mambaは、新しい状態空間モデルアーキテクチャで、言語モデリングなどの情報密度の高いデータに対して有望な性能を示しています。以前の準二次モデルがTransformerに劣る分野でも良好な結果を得ています。このモデルは、structured state space modelsの進歩に基づいており、FlashAttentionの精神に沿った効率的なハードウェア対応の設計と実装がなされています。

📦 インストール

必要なライブラリをインストールするには、以下のコマンドを実行します。

pip install torch==2.1.0 transformers==4.35.0 causal-conv1d==1.0.0 mamba-ssm==1.0.1

💻 使用例

基本的な使用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
from mamba_ssm.models.mixer_seq_simple import MambaLMHeadModel

CHAT_TEMPLATE_ID = "HuggingFaceH4/zephyr-7b-beta"

device = "cuda:0" if torch.cuda.is_available() else "cpu"
model_name = "clibrain/mamba-2.8b-instruct-openhermes"

eos_token = "<|endoftext|>"
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.eos_token = eos_token
tokenizer.pad_token = tokenizer.eos_token
tokenizer.chat_template = AutoTokenizer.from_pretrained(CHAT_TEMPLATE_ID).chat_template

model = MambaLMHeadModel.from_pretrained(
        model_name, device=device, dtype=torch.float16)

messages = []
prompt = "Tell me 5 sites to visit in Spain"
messages.append(dict(role="user", content=prompt))

input_ids = tokenizer.apply_chat_template(
            messages, return_tensors="pt", add_generation_prompt=True
).to(device)

out = model.generate(
    input_ids=input_ids,
    max_length=2000,
    temperature=0.9,
    top_p=0.7,
    eos_token_id=tokenizer.eos_token_id,
)

decoded = tokenizer.batch_decode(out)
assistant_message = (
    decoded[0].split("<|assistant|>\n")[-1].replace(eos_token, "")
)

print(assistant_message)

高度な使用法

Gradioデモを使用して、モデルをインタラクティブに試すことができます。以下のコマンドを実行して、デモを起動します。

git clone https://github.com/mrm8488/mamba-chat.git
cd mamba-chat

pip install -r requirements.txt
pip install -q gradio==4.8.0

python app.py \
--model clibrain/mamba-2.8b-instruct-openhermes \
--share

📚 ドキュメント

ベースモデル情報

データセット情報

OpenHermesデータセットは、主にGPT-4で生成された242,000件のエントリから構成されており、AI分野のさまざまなオープンデータセットを含んでいます。

OpenHermes 13Bは、Hermesデータセットの最初のファインチューニングモデルで、完全にオープンソースのデータセットを使用しています！

OpenHermesは、主にGPT-4で生成された242,000件のエントリを使用してトレーニングされており、AI分野のさまざまなオープンデータセットを含んでいます。

GPTeacher - General Instruct, Roleplay v1, Roleplay v2, and Code Instruct Datasets, by Teknium
WizardLM (v1, evol_instruct 70k), by WizardLM Team/nlpxucan
Airoboros GPT-4 (v1.0), by JonDurbin
Camel-AI's domain expert datasets, by the Camel-AI Team
CodeAlpaca, by Sahil2801
GPT4-LLM and Unnatural Instructions, by Microsoft

フィルタリングには、OpenAIの拒否、免責事項、「As an AI」タイプの例などの削除が含まれています。ベースデータセットの混合は、元のNous-Hermesと同じですが、Nous-InstructとPDACTLデータセットは非公開データセットであるため除外されています。