blockchainlabs_7Bオープンソース大規模モデル - 最適化と枝刈りを行い、デバイス端での柔軟な使用に対応

ホーム

Blockchainlabs 7B Merged Test2 4 Prune Sft 4bit DPO Orca

alnrg2argによって開発

これは、プルーニングとDPOトレーニングを行った7Bパラメータ規模の小型LLMで、デバイス端末用途向けに最適化されています。

大規模言語モデル

Transformers

英語#デバイス端末最適化 #プルーニングモデル #DPO微調整

ダウンロード数 18

リリース時間 : 1/23/2024

モデル概要

このモデルは、Mistralアーキテクチャに基づく7Bパラメータの言語モデルで、マージ、プルーニング（50%の疎度）、DPOトレーニングのプロセスで最適化されており、性能を維持しながらモデルサイズを削減することを目的としており、リソースが限られたデバイスに適しています。

モデル特徴

デバイス端末最適化

50%の疎度でプルーニングすることで、モデルサイズを大幅に削減し、リソースが限られたデバイスへのデプロイに適しています。

DPOトレーニング

直接嗜好最適化（DPO）方法を使用してトレーニングを行い、モデルの出力品質を向上させます。

高効率推論

8bit最適化とAdamWオプティマイザを採用し、推論効率を向上させます。

モデル能力

英語テキスト生成

命令追従

対話生成

使用事例

モバイルアプリ

デバイス端末チャットアシスタント

スマートフォンなどのモバイルデバイスに軽量なチャットボットをデプロイします。

応答品質を維持しながらリソースの使用量を削減します。

エッジコンピューティング

ローカライズされたテキスト処理

エッジデバイス上でテキスト生成と処理を行い、クラウド依存を必要としません。

プライバシー保護と応答速度を向上させます。

🚀 ブロックチェーンラボのテストモデル

このプロジェクトは、デバイス上で動作する小型の大規模言語モデル（LLM）を作成することを目的としています。具体的には、ブロックチェーンラボのテスト2.4から派生したモデル alnrg2arg/blockchainlabs_7B_merged_test2_4_prune を利用しています。

🚀 クイックスタート

今回の反復での全体的なパイプラインは以下の通りです。

ベースモデル（7B）を作成するためのマージ
モデルのパラメータを削減するためのプルーニング（50%の疎度）
プルーニングの回復フェーズとして、DPO（Direct Preference Optimization）を選択

このモデルはプルーニングされたモデルです。

💻 使用例

基本的な使用法

from transformers import TrainingArguments, AutoModelForCausalLM
from trl import DPOTrainer

dpo_trainer = DPOTrainer(
    model = model,
   
    ref_model = None,
    args = TrainingArguments(
        per_device_train_batch_size = 8,
        gradient_accumulation_steps = 8,
        warmup_ratio = 0.1,
        num_train_epochs = 3,
        learning_rate = 5e-6,
        fp16 = not torch.cuda.is_bf16_supported(),
        bf16 = torch.cuda.is_bf16_supported(),
        logging_steps = 1,
        optim = "adamw_8bit",
        weight_decay = 0.0,
        lr_scheduler_type = "linear",
        seed = 42,
        output_dir = "output_DPO",
    ),
    beta = 0.1,
    train_dataset = dataset,
    # eval_dataset = raw_datasets["test"],
    tokenizer = tokenizer,
    max_length = 1024,
    max_prompt_length = 512,
)

このコードとパラメータは、https://colab.research.google.com/drive/1SKrKGV-BZoU4kv5q3g0jtE_OhRgPtrrQ?usp=sharing から借用しています。

📄 ライセンス

このモデルは CC BY-NC 4.0 ライセンスの下で提供されています。

属性	详情
ベースモデル	alnrg2arg/blockchainlabs_7B_merged_test2_4_prune
データセット	Intel/orca_dpo_pairs
タグ	text-generation-inference, transformers, unsloth, mistral, trl