DeciLM-6b-instructオープンソース英語言語モデル - 短形式の命令追従をサポートする無料デプロイ

ホーム

Decilm 6b Instruct

Deciによって開発

DeciLM 6B-指示モデルは、短い形式の指示追従に特化した英語言語モデルで、DeciLM 6BをLoRAファインチューニング技術でトレーニングしたものです

大規模言語モデル

Transformers

英語オープンソースライセンス:その他 #効率的な推論最適化 #英語の指示追従 #ビジネス研究汎用

ダウンロード数 105

リリース時間 : 9/13/2023

モデル概要

DeciLM 6Bを最適化した指示追従モデルで、英語圏のビジネスや研究用途に適しており、他の言語環境にもファインチューニングで対応可能

モデル特徴

効率的な推論

可変グループクエリ注意メカニズムを採用し、推論効率を大幅に向上

指示最適化

短い形式の指示追従シナリオに特化し、OpenOrcaデータセットでファインチューニング

高性能

ARCチャレンジ(44.43)、HellaSwag(74.57)など、複数のベンチマークテストで優れた成績

モデル能力

英語テキスト生成

指示理解と実行

質問応答システム

知識推論

使用事例

ビジネスアプリケーション

カスタマーサポートアシスタント

自動化されたカスタマーサポートシステム構築に使用、よくある質問への対応

教育研究

教育補助

教材やステップバイステップの指導説明を生成

🚀 DeciLM 6B-Instruct

DeciLM 6B-Instructは、短文の指示に従うためのモデルです。このモデルは、DeciLM 6BをOpenOrcaデータセットのサブセットでLoRA微調整することで構築されています。

🔍 モデル情報

属性	详情
開発元	Deci
モデルタイプ	DeciLMは、可変Grouped-Query Attentionを含む最適化されたトランスフォーマーデコーダアーキテクチャを使用した自己回帰型言語モデルです。
言語	英語
ライセンス	Llama 2 Community License Agreement と、ホスティングサービスプロバイダに関するDeciの拡張条項

📚 モデルソース

🚀 クイックスタート

このモデルは、英語での商用および研究用途を目的としており、他の言語での使用のために微調整することができます。

モデルの使用開始方法

以下のコードを使用して、モデルを使用を開始できます。

# pip install -q transformers

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

checkpoint = "Deci/DeciLM-6b-instruct"
device = "cuda" # for GPU usage or "cpu" for CPU usage

tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint, torch_dtype=torch.bfloat16, trust_remote_code=True).to(device)

inputs = tokenizer.encode("How do I make french toast? Think through it step by step", return_tensors="pt").to(device)
outputs = model.generate(inputs, max_new_tokens=100, do_sample=True, top_p=0.95)
print(tokenizer.decode(outputs[0]))

🔧 学習詳細

DeciLM 6Bは、SlimPijamasデータセットを利用して学習され、高速学習を可能にする高度な独自の手法を用いています。その後、DeciLM 6BはOpenOrcaデータセットのサブセットでさらに微調整され、DeciLM-6B-Instructが生まれました。

📊 評価

以下は、DeciLM 6B-Instructの評価結果です。

平均	ARC Challenge*	ARC Easy*	BoolQ	HellaSwag*	LAMBDA OpenAI	OpenBookQA	PIQA	TruthfulQA	Winogrande
62.01	44.43	70.58	77.34	74.57	70.1	33	77.52	43.89	67.64
Accuracy-norm score*

⏱️ 実行時ベンチマーク

推論ツール/ハードウェア	A10 (トークン/秒)
PyTorch	652.49
Infery LLM	2,029.6

スループット (トークン/秒) - 最適なバッチで測定 - PyTorch BS 64、Infery LLM BS 128
PyTorchベンチマークの結果を再現するには、このコード例を使用してください

⚠️ 免責事項

DeciLM 6B-Instructは、安全性に関して調整されておらず、RLHFを使用して学習されていません。

📝 引用方法

このモデルを引用する場合は、以下の形式を使用してください。

@misc{DeciFoundationModels,
title = {DeciLM 6B Instruct},
author = {DeciAI Research Team},
year = {2023}
url={[https://huggingface.co/Deci/DeciLM-6b-instruct](https://huggingface.co/Deci/DeciLM-6b-instruct)},
}