japanese-stablelm-instruct-alpha-7bオープンソース日本語言語モデル - 無料でのデプロイで様々なコンテンツ生成をサポート

ホーム

Japanese Stablelm Instruct Alpha 7b

stabilityaiによって開発

70億パラメータデコーダーを基にした日本語指示ファインチューニング言語モデル、生成タスクに適しています

大規模言語モデル

Transformers

日本語オープンソースライセンス:その他 #日本語指示ファインチューニング #マルチターン対話生成 #日英バイリンガル処理

ダウンロード数 578

リリース時間 : 8/10/2023

モデル概要

このモデルはJapanese-StableLM-Base-Alpha-7Bをベースに複数の指示データセットでファインチューニングされた因果言語モデルで、日本語の指示理解と応答能力に特化して最適化されています

モデル特徴

指示ファインチューニング最適化

Alpaca/Dolly/HHなどの有名データセットの日本語訳版でファインチューニングを行い、指示追従能力を大幅に向上

効率的なトークン処理

NovelAIが最適化したtokenizerを採用し、日英混合テキストの処理効率に優れる

研究フレンドリーなライセンス

非商用目的での改変と再配布を許可、学術研究シナリオに適しています

モデル能力

日本語テキスト生成

指示理解と応答

マルチターン対話シミュレーション

知識質問応答

使用事例

教育支援

概念説明

技術用語の平易な説明を生成（例：VR/ARの違い）

構造化された比較リストを出力可能

コンテンツ作成

下書き生成

簡潔な指示から完全な段落へ自動拡張

日本語表現に適したテキストを生成

🚀 Japanese-StableLM-Instruct-Alpha-7B

Japanese-StableLM-Instruct-Alpha-7Bは、日本語での自然言語処理タスクに特化した言語モデルです。事前学習モデルをベースに、指示に従った応答を生成する能力を強化するために微調整されています。

🚀 クイックスタート

このセクションでは、Japanese-StableLM-Instruct-Alpha-7Bを使用するための基本的な手順を説明します。

依存関係のインストール

まず、requirements.txtに記載されている追加の依存関係をインストールします。

pip install sentencepiece einops

テキスト生成のコード例

以下のコードスニペットを使用して、Japanese-StableLM-Instruct-Alpha-7Bでテキスト生成を開始します。

import torch
from transformers import LlamaTokenizer, AutoModelForCausalLM

tokenizer = LlamaTokenizer.from_pretrained("novelai/nerdstash-tokenizer-v1", additional_special_tokens=['▁▁'])

model = AutoModelForCausalLM.from_pretrained(
    "stabilityai/japanese-stablelm-instruct-alpha-7b",    
    trust_remote_code=True,
)
model.half()
model.eval()

if torch.cuda.is_available():
    model = model.to("cuda")

def build_prompt(user_query, inputs="", sep="\n\n### "):
    sys_msg = "以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。"
    p = sys_msg
    roles = ["指示", "応答"]
    msgs = [": \n" + user_query, ": "]
    if inputs:
        roles.insert(1, "入力")
        msgs.insert(1, ": \n" + inputs)
    for role, msg in zip(roles, msgs):
        p += sep + role + msg
    return p

# this is for reproducibility.
# feel free to change to get different result
seed = 42
torch.manual_seed(seed)

# Infer with prompt without any additional input
user_inputs = {
    "user_query": "VR とはどのようなものですか？",
    "inputs": ""
}
prompt = build_prompt(**user_inputs)

input_ids = tokenizer.encode(
    prompt, 
    add_special_tokens=False, 
    return_tensors="pt"
)

tokens = model.generate(
    input_ids.to(device=model.device),
    max_new_tokens=256,
    temperature=1,
    top_p=0.95,
    do_sample=True,
)

out = tokenizer.decode(tokens[0][input_ids.shape[1]:], skip_special_tokens=True).strip()
print(out)
"""バーチャルリアリティは、現実の世界のように見える仮想世界の 3D 仮想現実のシミュレーションです。これは、ヘッドセットを介して、ユーザーが見たり、聞いたり、体験できるものです。"""

seed = 42
torch.manual_seed(seed)

# Infer with prompt with additional input
user_inputs = {
    "user_query": "VR について、以下の比較対象との違いを箇条書きで教えてください。",
    "inputs": "比較対象: AR"
}
prompt = build_prompt(**user_inputs)

input_ids = tokenizer.encode(
    prompt, 
    add_special_tokens=False, 
    return_tensors="pt"
)

tokens = model.generate(
    input_ids.to(device=model.device),
    max_new_tokens=256,
    temperature=1,
    top_p=0.95,
    do_sample=True,
)

out = tokenizer.decode(tokens[0][input_ids.shape[1]:], skip_special_tokens=True).strip()
print(out)
"""
以下は、VR と AR の比較対象の比較です。
1. VR はユーザーが3D の世界を体験することを可能にし、ユーザーが自分の目で世界を見ることを可能にします。
2. VR は、ユーザーが目の前の環境をより詳細に感じ、より多くのことができるようにすることを可能にします。
3. VR は、ユーザーの感覚を刺激し、拡張することを可能にします。
4. VR は、視覚的、触覚的、および聴覚的な感覚体験を提供するために使用されます。
5. AR は、現実の世界に重ね合わせて、情報を表示し、ユーザーに拡張現実体験を提供することを可能にします。
6. AR は、ユーザーが仮想オブジェクトを仮想環境に持ち込むことを可能にするため、物理的な世界をシミュレートするのに最適です。
7. VR は、3D 世界を実現する仮想世界を作成することに最適です。
8. AR は、ユーザーが現実世界のオブジェクトをシミュレートし、現実世界の現実的な世界に重ね合わせて情報を表示することを可能にします。
9. VR は、ユーザーの感覚や感情に与える影響が最も大きいと考えられています。
"""

✨ 主な機能

指示に従った応答生成：ユーザーの指示に基づいて適切な応答を生成することができます。
日本語対応：日本語の自然言語処理タスクに特化しています。

📦 インストール

依存関係のインストールについては、「クイックスタート」セクションを参照してください。

pip install sentencepiece einops

📚 ドキュメント

モデルの詳細

属性	详情
モデルタイプ	`japanese-stablelm-instruct-alpha-7b`は、NeoXトランスフォーマーアーキテクチャに基づく自己回帰型言語モデルです。
言語	日本語
ライブラリ	GPT-NeoX
ライセンス	このモデルは、JAPANESE STABLELM RESEARCH LICENSE AGREEMENTの下でライセンスされています。

学習に関する情報

学習パラメータ

パラメータ	隠れ層サイズ	レイヤー数	ヘッド数	シーケンス長
7B	4096	32	32	1024

学習データセット

japanese-stablelm-instruct-alpha-7bは、以下のデータセットの組み合わせで微調整されています。

📄 ライセンス

このリポジトリは公開されていますが、ファイルやコンテンツにアクセスするには条件に同意する必要があります。詳細については、JAPANESE STABLELM RESEARCH LICENSE AGREEMENTを参照してください。

JAPANESE STABLELM RESEARCH LICENSE AGREEMENT

日付: 2023年8月7日

「契約」とは、本書に定めるソフトウェア製品の使用、複製、配布、および改変に関する条件を意味します。

「ドキュメント」とは、Stability AIがソフトウェアに関連して提供する仕様書、マニュアル、ドキュメント、およびその他の書面情報を意味します。

「ライセンシー」または「あなた」とは、あなた、またはあなたの雇用主、またはあなたがこの契約を代表して締結する他の個人または団体を意味します。適用される法律、規則、または規制に基づいて法的同意を与えることができる年齢であり、あなたが彼らの代理でこの契約に締結する場合、あなたの雇用主またはその他の個人または団体を拘束する法的権限を有するものとします。

「Stability AI」または「私たち」とは、Stability AI Ltd.を意味します。

「ソフトウェア」とは、総称して、本契約の下で提供されるStability AIの独自のJapanese StableLMを意味します。

「ソフトウェア製品」とは、ソフトウェアとドキュメントを意味します。

ソフトウェア製品の一部または要素を使用または配布することにより、あなたはこの契約に拘束されることに同意するものとします。

ライセンス権限と再配布
- あなたがこの契約およびドキュメントに従うことを条件として、Stability AIは、ソフトウェア製品に含まれるStability AIの知的財産権またはその他の権利の下で、非独占的、世界規模、非譲渡可能、非サブライセンス可能、取消可能、無料、および限定的なライセンスを付与し、ソフトウェア製品の複製、配布、および派生作品の作成を商業的または生産的な使用以外の目的で行うことができます。
- あなたは、第三者がソフトウェア製品（またはその派生作品、ソフトウェア製品を組み込んだ作品、またはソフトウェアによって生成されたデータ）を商業的または生産的な目的で全体または一部を使用、改変、複製、複製、派生作品の作成、または配布することを許可、支援、または引き起こさないものとします。
- あなたがソフトウェア製品またはその派生作品を第三者に配布または提供する場合、あなたは（i）この契約のコピーをその第三者に提供し、（ii）そのコピーの一部として配布される「Notice」テキストファイル内に以下の帰属通知を保持するものとします。「Japanese StableLMは、Japanese StableLM Research Licenseの下でライセンスされており、Copyright (c) Stability AI Ltd. All Rights Reserved.」
- 本契約の下であなたに付与されるライセンスは、あなたがドキュメントおよび本契約に従うことを条件とします。これには、以下の許容使用ポリシーおよび将来stability.aiで随時更新される可能性のあるポリシーが含まれ、これらは本契約に参照により組み込まれます。
保証の否認：適用される法律により要求されない限り、ソフトウェア製品およびそれから得られるすべての出力および結果は、「現状のまま」で提供され、明示的または黙示的ないかなる種類の保証も含まれません。これには、所有権、非侵害、商品性、または特定の目的に適合することに関する保証が含まれます。あなたは、ソフトウェア製品の使用または再配布の適切性を独自に判断し、ソフトウェア製品の使用およびそれから得られるすべての出力および結果に関連するすべてのリスクを負うものとします。
責任の制限：いかなる場合も、Stability AIまたはその関連会社は、本契約に起因するいかなる責任理論に基づいても、契約、不法行為、過失、製品責任、またはその他の理由により、利益損失またはいかなる間接的、特別な、結果的、偶発的、模範的、または懲罰的損害に対して責任を負わないものとします。たとえStability AIまたはその関連会社がそれらの可能性について通知されていた場合でも同様です。
知的財産
- 本契約の下では商標ライセンスは付与されず、ソフトウェア製品に関連して、Stability AIまたはライセンシーは、ソフトウェア製品の説明および再配布における合理的かつ慣習的な使用に必要な場合を除き、相手方またはその関連会社が所有するまたは関連するいかなる名称またはマークも使用できません。
- Stability AIによるまたはStability AIのために作成されたソフトウェア製品および派生作品のStability AIの所有権を前提として、あなたが作成するソフトウェア製品の派生作品および改変に関して、あなたとStability AIの間で、あなたはそれらの派生作品および改変の所有者であり、かつ所有者であり続けるものとします。
- あなたがStability AIに対して訴訟またはその他の手続き（訴訟における交差請求または反訴を含む）を提起し、ソフトウェア製品または関連する出力または結果、またはそれらのいずれかの一部があなたが所有またはライセンスすることができる知的財産権またはその他の権利の侵害を構成すると主張する場合、本契約の下であなたに付与されたすべてのライセンスは、その訴訟または請求が提起された日から終了するものとします。あなたは、本契約に違反してソフトウェア製品を使用または配布することに起因するまたは関連する第三者からのいかなる請求からもStability AIを弁護し、免責するものとします。
契約期間と終了：本契約の期間は、あなたが本契約を受諾した日またはソフトウェア製品にアクセスした日から開始し、本契約の条件に従って終了するまで有効です。あなたが本契約のいずれかの条件に違反した場合、Stability AIは本契約を終了することができます。本契約の終了時には、あなたはソフトウェア製品を削除し、使用を停止するものとします。第2 - 4条は、本契約の終了後も有効です。

Japanese StableLM許容使用ポリシー

あなたがStability AIのモデル、ソフトウェア、またはその他の資料（「Stability Technology」）にアクセス、使用、または配布する場合、あなたはこの許容使用ポリシー（「ポリシー」）に同意するものとします。私たちは、誰もがStability Technologyを安全かつ責任を持って使用することを望んでいます。あなたは、Stability Technologyを以下の目的で使用しないこと、または他人に使用させないことに同意するものとします。

法律または他人の権利（知的財産権、データのプライバシーおよび保護の権利を含む）を侵害すること、または他人の法律または他人の権利の侵害を促進、寄与、助長、容易にする、計画する、扇動する、またはさらに進めること。
以下のいずれかを行う、促進する、寄与する、容易にする、助長する、計画する、扇動する、またはさらに進めること。
- 暴力またはテロリズム
- 子供の搾取または危害、子供の搾取的コンテンツの勧誘、作成、取得、または拡散を含む
- 人身売買、搾取、および性的暴力
- 個人または個人のグループに対する嫌がらせ、虐待、脅迫、ストーキング、またはいじめ
- 人種、肌の色、カースト、宗教、性別（妊娠、性的指向、または性同一性を含む）、国籍、年齢、障害、または遺伝情報（家族の病歴を含む）に基づく雇用、雇用福利厚生、信用、住宅、その他の経済的利益、またはその他の重要な商品またはサービスの提供における差別。ただし、適用される法律により必要とされる場合（例えば、法律に基づく特定の年齢要件を満たす人にのみ社会保障給付を提供する場合）を除きます。
- 悪意のあるコード、マルウェア、コンピュータウイルスの作成、またはウェブサイトまたはコンピュータシステムの正常な動作、整合性、操作、または外観を無効化、過負荷にする、干渉する、または損なう可能性のあるいかなる活動
以下の目的または実行のために使用すること。
- 個人または個人のグループに関する完全自動化された意思決定、プロファイリングを含み、それが当該個人に関する法的効果を生じるまたは同様に当該個人に重大な影響を与える場合
- 個人を特定できるデータの系統的または自動的なスクレイピング、採掘、抽出、または収集、または同様の活動。ただし、あなたがStability Technologyに入力として提供し、法的に処理する権限を有するデータに関して、その権限を保持する限りは除きます。
- 大量破壊兵器（核兵器、化学兵器、または生物兵器など）、戦争兵器（ミサイルまたは地雷など）の開発、改良、または製造、または病原体に関する機能獲得関連活動
- 業界のベストプラクティスがフェールセーフ制御またはパフォーマンスを要求するミッションクリティカルなアプリケーションまたはシステム、原子力施設の運転、航空機の航行、電力網、通信システム、水処理施設、航空交通管制、生命維持装置、兵器システム、または緊急救助装置またはその他の緊急サービスを含む
意図的に他人を欺くまたは誤解させること、以下に関連するJapanese StableLMの使用を含む。
- 詐欺の生成、促進、またはさらなる拡散、または誤情報の作成または促進
- 中傷的なコンテンツの生成、促進、またはさらなる拡散、中傷的な声明、画像、またはその他のコンテンツの作成を含む
- スパムの生成、促進、またはさらなる配布
- 同意、許可、または法的権利なしに他人をなりすますこと
- Japanese StableLMの使用または出力が人間によって生成されたものであると人々に誤解させること
- 偽のオンラインエンゲージメントの生成または容易化、偽のレビューおよびその他の偽のオンラインエンゲージメントの手段を含む
- 大規模な政治広告、宣伝、または影響キャンペーンの生成または容易化
あなたのAIシステムの既知の危険性をエンドユーザーに適切に開示しないこと、またはその能力に関して誤った表示または誤解を与えること。この許容使用ポリシーのいかなる部分も、Japanese StableLMの善意の研究、テスト、または評価、またはそれらに関連する公開を妨げることを意図するものではありません。あなたがJapanese StableLMに人に害を与える可能性のある欠陥を発見した場合、私たちに通知し、他の人がそれを悪用する前にその欠陥を修正する機会を与えることをお勧めします。この許容使用ポリシーに関する質問がある場合は、legal@stability.aiまでお問い合わせください。