🚀 狸貓-8B-dpo-v1.0
狸貓-8B-dpo-v1.0是一款大規模語言模型,在多方面表現出色。它基於約80億參數,經過約1.3T令牌的從頭預訓練,並通過SFT和DPO進行對話調整。本項目由GENIAC松尾研LLM開發項目組織,眾多有志參與者共同開發。
🚀 快速開始
狸貓-8B是一個約80億參數的大規模語言模型,經過約1.3T令牌的從頭預訓練。狸貓-8x8B-dpo-v1.0則通過SFT和DPO進行了對話調整。更多詳細信息請參考博客文章。
本項目由GENIAC松尾研LLM開發項目組織,由通過公開招募聚集的有志參與者(包括企業人員、學生、研究人員等)共同開發。
✨ 主要特性
- 預訓練充分:約80億參數的模型經過約1.3T令牌的從頭預訓練。
- 對話優化:通過SFT和DPO進行對話調整。
- 多版本支持:提供多種量子化版本。
- 基準測試:有人工評估和Japanese MT - Bench等測試數據。
📦 安裝指南
文檔未提及安裝步驟,暫不提供。
💻 使用示例
基礎用法
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("weblab-GENIAC/Tanuki-8B-dpo-v1.0", device_map="auto", torch_dtype="auto")
tokenizer = AutoTokenizer.from_pretrained("weblab-GENIAC/Tanuki-8B-dpo-v1.0")
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
messages = [
{"role": "system", "content": "以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。"},
{"role": "user", "content": "たぬきに純粋理性批判は理解できますか?"}
]
input_ids = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
output_ids = model.generate(input_ids,
max_new_tokens=1024,
temperature=0.5,
streamer=streamer)
📚 詳細文檔
量子化模型
⚠️ 重要提示
GGUF版可能存在性能下降問題,不建議使用。
提示格式
狸貓-8B-dpo-v1.0使用日語版Alpaca的提示格式。
💡 使用建議
本模型除了默認的系統提示“以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。”外沒有學習其他提示,建議使用此係統提示。請在用戶提示中描述任務的詳細信息。
基準測試
人工評估
創建了一個模擬Chatbot Arena的系統,並進行了人工盲測。(詳情請參考此處)
已公開所有評估數據(約2000條)。

Japanese MT - Bench
由GPT - 4進行評估 (gpt - 4 - 0613,在計算平均分數時排除分數為 - 1的情況)
屬性 |
詳情 |
平均分數 |
狸貓-8B-dpo-v1.0為7.24,狸貓-8x8B-dpo-v1.0為7.96 |
編碼 |
狸貓-8B-dpo-v1.0為5.4,狸貓-8x8B-dpo-v1.0為6.75 |
提取 |
狸貓-8B-dpo-v1.0為6.65,狸貓-8x8B-dpo-v1.0為6.90 |
人文 |
狸貓-8B-dpo-v1.0為9.1,狸貓-8x8B-dpo-v1.0為9.3 |
數學 |
狸貓-8B-dpo-v1.0為3.9,狸貓-8x8B-dpo-v1.0為5.75 |
推理 |
狸貓-8B-dpo-v1.0為5.75,狸貓-8x8B-dpo-v1.0為7.35 |
角色扮演 |
狸貓-8B-dpo-v1.0為8.75,狸貓-8x8B-dpo-v1.0為8.95 |
科學技術 |
狸貓-8B-dpo-v1.0為9.35,狸貓-8x8B-dpo-v1.0為9.40 |
寫作 |
狸貓-8B-dpo-v1.0為9.05,狸貓-8x8B-dpo-v1.0為8.85 |
開發成員
畠山 歓 [領導者]、asaoka_tadashi、Atsushi Saito、Chattso - GPT、Chihiro Arata、Chihiro HIGUCHI、Daichi Kohmoto、Esty、Hideaki Hayashi、hiroaki shioya、Issei Fujimoto、Jie Zeng、Jinsei Shiraishi、K. Nishizawa、Kazutaka Nishimae、Kunihiro Watanabe、masaki okamura、Minami Someya、M先生、Nishi、Nishijima、p1atdev、Rumi Nakagawa、Ryota Mitsuhashi、Susumu Ota、takagi、Toshio Nishida、y_morinaga、Yuki Namiuchi、Yukie Kawano、永原恆治、加藤純、河越 淳、巖田 兼太朗、菊池満帆、熊田匡仁、江國翔太、佐野敏幸、山口 裕輝、西井康隆、川村 正春、片上 舜、堀江吏將、林寛太 (Kanta Hayashi)
📄 許可證
本項目採用Apache - 2.0許可證。