🚀 Qwen/Qwen-14B-Chat + Karasu微调数据集项目
本项目基于Qwen/Qwen-14B-Chat模型,结合Karasu的微调数据集,在特定任务上展现出了优秀的性能。
🚀 快速开始
模型演示
模型演示链接
博客文章
相关说明文章
✨ 主要特性
在内部评估中,发现Qarasu模型在MT - Bench基准测试中表现出了特别高的性能,目前正在等待外部评估结果。
📦 安装指南
此部分文档未提供具体安装步骤,暂不展示。
💻 使用示例
基础用法
Huggingface使用示例
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか?"})
prompt = tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)
pipe(prompt, max_new_tokens=100, do_sample=False, temperature=0.0, return_full_text=False)
VLLM使用示例
from vllm import LLM, SamplingParams
sampling_params = SamplingParams(temperature=0.0, max_tokens=100)
llm = LLM(model="lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)
messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか?"})
prompt = llm.llm_engine.tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)
prompts = [prompt]
outputs = llm.generate(prompts, sampling_params)
for output in outputs:
prompt = output.prompt
generated_text = output.outputs[0].text
print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
📚 详细文档
基础模型
Qwen/Qwen-14B-Chat
训练数据集(总计约7B)
与“plus”检查点相同,但从类别数据集中过滤掉了约6K条拒绝回复(“申し訳ありませんが、。。。”)
开发团队
工程师
顾问
- Yuuki Yamanaka
- Atom Sonoda
项目经理
数据集评估员
📄 许可证
本项目使用的许可证为 Tongyi Qianwen LICENSE AGREEMENT。