チューリッヒ7B - GCv2 - 100kオープンソース対話モデル - ガンマコーパスで訓練され、スマートな交流・インタラクションを実現

ホーム

Zurich 7B GCv2 100k

rubenroyによって開発

Qwen 2.5 7B Instructモデルをファインチューニングした対話モデルで、ガンマコーパスv2-100kでトレーニング

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #マルチターン対話最適化 #Unsloth効率的なファインチューニング #中国語Q&A強化

ダウンロード数 45

リリース時間 : 1/28/2025

モデル概要

このモデルはAlibabaのQwen 2.5 7B Instructモデルをベースにしたファインチューニング版で、ガンマコーパスによるトレーニングにより同サイズのモデルを超える高品質な対話体験を提供します。

モデル特徴

効率的なファインチューニング

Unslothフレームワークを使用し、単一のT4 GPUでわずか70分でファインチューニングを完了

先進的なアーキテクチャ

回転位置エンコーディング、SwiGLU活性化関数などの最新技術を採用

高品質なトレーニングデータ

厳選されたガンマコーパスv2-100k版でトレーニング

モデル能力

マルチターン対話生成

Q&Aシステム

テキスト生成

チャット機能

使用事例

対話システム

インテリジェントアシスタント

情報検索や日常的なQ&Aサービスを提供するスマート対話アシスタントとして利用可能

カスタマーサービスシステム

自動化されたカスタマーサービス対話システムの構築に適しています

教育

学習アシスタント

学生の様々な知識に関する質問に回答

🚀 Zurich 7B GammaCorpus v2-100k

GammaCorpusデータセットでファインチューニングされたQwen 2.5モデル

このモデルは、AlibabaのQwen 2.5 7B InstructモデルをGammaCorpusデータセットでファインチューニングしたもので、同サイズの他のモデルを上回る性能を発揮します。

🚀 クイックスタート

Zurich 7B GammaCorpus v2-100kは、AlibabaのQwen 2.5 7B Instructモデルをファインチューニングしたものです。同サイズの他のモデルを上回る性能を発揮し、GammaCorpus v2-100kを活用しています。

✨ 主な機能

モデルの詳細

Property	Details
Base Model	Qwen/Qwen2.5-7B-Instruct
Model Type	Causal Language Models
Architecture	Transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias
Number of Parameters	7.61B
Number of Paramaters (Non-Embedding)	6.53B
Number of Layers	28
Number of Attention Heads (GQA)	28 for Q and 4 for KV

トレーニングの詳細

Zurich-7B-GCv2-100kは、1つのT4 GPUを使用して約70分間ファインチューニングされ、Unslothフレームワークでトレーニングされました。60エポックでトレーニングされました。

📦 インストール

必要条件

transformersパッケージの最新バージョンの使用を強くおすすめします。以下のコマンドでpipを使用してインストールできます。

pip install transformers

💻 使用例

基本的な使用法

以下は、apply_chat_templateを使用してトークナイザーとモデルをロードし、コンテンツを生成するコードスニペットです。

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "rubenroy/Zurich-7B-GCv2-100k"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "How tall is the Eiffel tower?"
messages = [
    {"role": "system", "content": "You are Zurich, an AI assistant built on the Qwen 2.5 7B model developed by Alibaba Cloud, and fine-tuned by Ruben Roy. You are a helpful assistant."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

📚 ドキュメント

GammaCorpusについて

このモデルとすべてのZurichモデルは、GammaCorpusでトレーニングされています。GammaCorpusは、HuggingFace上のデータセットで、構造化されたフィルタリング済みのマルチターン会話が含まれています。 GammaCorpusには、それぞれ異なるサイズの4つのバージョンがあります。以下は各バージョンとサイズです。