🚀 Qwen/Qwen-14B-Chat + Karasu微調數據集項目
本項目基於Qwen/Qwen-14B-Chat模型,結合Karasu的微調數據集,在特定任務上展現出了優秀的性能。
🚀 快速開始
模型演示
模型演示鏈接
博客文章
相關說明文章
✨ 主要特性
在內部評估中,發現Qarasu模型在MT - Bench基準測試中表現出了特別高的性能,目前正在等待外部評估結果。
📦 安裝指南
此部分文檔未提供具體安裝步驟,暫不展示。
💻 使用示例
基礎用法
Huggingface使用示例
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか?"})
prompt = tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)
pipe(prompt, max_new_tokens=100, do_sample=False, temperature=0.0, return_full_text=False)
VLLM使用示例
from vllm import LLM, SamplingParams
sampling_params = SamplingParams(temperature=0.0, max_tokens=100)
llm = LLM(model="lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)
messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか?"})
prompt = llm.llm_engine.tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)
prompts = [prompt]
outputs = llm.generate(prompts, sampling_params)
for output in outputs:
prompt = output.prompt
generated_text = output.outputs[0].text
print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
📚 詳細文檔
基礎模型
Qwen/Qwen-14B-Chat
訓練數據集(總計約7B)
與“plus”檢查點相同,但從類別數據集中過濾掉了約6K條拒絕回覆(“申し訳ありませんが、。。。”)
開發團隊
工程師
顧問
- Yuuki Yamanaka
- Atom Sonoda
項目經理
數據集評估員
📄 許可證
本項目使用的許可證為 Tongyi Qianwen LICENSE AGREEMENT。