Stockmark-2-100B-Instruct-betaオープンソース大規模モデル - 日本語での会話交流に特化した無料利用可能

ホーム

Stockmark 2 100B Instruct Beta

stockmarkによって開発

Stockmark-2-100Bは日本語能力に特化した1000億パラメータの大規模言語モデルで、1.5兆トークンの多言語データで事前学習され、日本語合成データにより指示追従能力が強化されています。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:MIT #1000億パラメータ大規模モデル #日本語最適化 #多言語混合トレーニング

ダウンロード数 1,004

リリース時間 : 3/5/2025

モデル概要

これはテスト版の大規模言語モデルで、特に日本語処理能力が最適化されており、指示による微調整でユーザーとの対話能力が強化されています。

モデル特徴

大規模パラメータ

1000億パラメータを有し、強力な言語理解と生成能力を備えています

日本語最適化

特に日本語能力に特化しており、トレーニングデータの30%が日本語です

指示追従

日本語合成データを用いて指示追従能力を強化するトレーニングを実施

多言語サポート

日本語と英語をサポートし、トレーニングデータは英語60%、日本語30%を含みます

モデル能力

日本語テキスト生成

英語テキスト生成

指示理解と実行

マルチターン対話

使用事例

言語処理

日本語QAシステム

日本語ユーザー向けのインテリジェントQAアプリケーション構築

多言語コンテンツ生成

日本語と英語のテキストコンテンツを生成

教育

日本語学習アシスタント

学習者が日本語の会話とライティングを練習するのを支援

🚀 Stockmark-2-100B-Instruct-beta

Stockmark-2-100B-Instruct-betaは、特に日本語に焦点を当てて構築された1000億パラメータの大規模言語モデルです。このモデルは、約1.5兆トークンのデータで事前学習されており、そのデータ構成は英語が60%、日本語が30%、コードが10%です。事前学習の後、Qwen2.5-32B-Instructを用いて生成された日本語の合成データで追加学習を行い、指示に沿った応答能力を強化しています。

ベータ版として、Stockmark-2-100B-Instruct-betaはまだ改善と評価の段階にあります。ユーザーからのフィードバックと洞察は、将来のバージョンの改良に役立ちます。

詳細についてはブログ記事をご覧ください。

このプロジェクトはGENIACによって支援されています。

image/jpeg

🚀 クイックスタート

このセクションでは、Stockmark-2-100B-Instruct-betaを使用するための基本的な手順を説明します。

💻 使用例

基本的な使用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("stockmark/Stockmark-2-100B-Instruct-beta")
model = AutoModelForCausalLM.from_pretrained(
    "stockmark/Stockmark-2-100B-Instruct-beta", device_map="auto", torch_dtype=torch.bfloat16
)

instruction = "自然言語処理とは？"
input_ids = tokenizer.apply_chat_template(
    [{"role": "user", "content": instruction}], add_generation_prompt=True, return_tensors="pt"
).to(model.device)

with torch.inference_mode():
    tokens = model.generate(
        input_ids,
        max_new_tokens = 512,
        do_sample = True,
        temperature = 0.7,
        top_p = 0.95,
        repetition_penalty = 1.05
    )
    
output = tokenizer.decode(tokens[0], skip_special_tokens=True)
print(output)