Qarasu-14B-chat-plus-unleashed开源对话模型 - 支持日英双语高质量交流

首页

Qarasu 14B Chat Plus Unleashed

由 lightblue 开发

Qarasu是基于Qwen-14B-Chat微调的日语和英语对话模型，在MT-Bench基准测试中表现优异。

大型语言模型

Transformers

支持多种语言开源协议:其他 #日语英语双语 #聊天助手优化 #大语言模型14B

下载量 51

发布时间 : 12/22/2023

模型简介

Qarasu是一个基于Qwen-14B-Chat微调的多语言对话模型，专注于日语和英语交流，适用于AI助手等场景。

模型特点

多语言支持

专注于日语和英语对话，适合双语应用场景

高质量微调

基于约70亿条高质量数据进行微调，过滤了低质量回答

优异基准表现

在MT-Bench基准测试中表现突出

模型能力

日语对话生成

英语对话生成

多轮对话处理

问答系统

使用案例

AI助手

日语问答助手

回答用户关于各种主题的日语问题

示例中正确回答了关于英国首相的问题

客户服务

双语客服机器人

处理日语和英语客户的咨询

🚀 Qwen/Qwen-14B-Chat + Karasu微调数据集项目

本项目基于Qwen/Qwen-14B-Chat模型，结合Karasu的微调数据集，在特定任务上展现出了优秀的性能。

drawing

🚀 快速开始

模型演示

模型演示链接

博客文章

✨ 主要特性

在内部评估中，发现Qarasu模型在MT - Bench基准测试中表现出了特别高的性能，目前正在等待外部评估结果。

📦 安装指南

此部分文档未提供具体安装步骤，暂不展示。

💻 使用示例

基础用法

Huggingface使用示例

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True)

pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)

messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか？"})

prompt = tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)

pipe(prompt, max_new_tokens=100, do_sample=False, temperature=0.0, return_full_text=False)

VLLM使用示例

from vllm import LLM, SamplingParams

sampling_params = SamplingParams(temperature=0.0, max_tokens=100)
llm = LLM(model="lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)

messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか？"})
prompt = llm.llm_engine.tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)
prompts = [prompt]

outputs = llm.generate(prompts, sampling_params)
for output in outputs:
    prompt = output.prompt
    generated_text = output.outputs[0].text
    print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")

📚 详细文档

基础模型

Qwen/Qwen-14B-Chat

训练数据集（总计约7B）

与“plus”检查点相同，但从类别数据集中过滤掉了约6K条拒绝回复（“申し訳ありませんが、。。。”）

Lightblue的Kujira数据集套件（未发布）
Lightblue自己的基于问题的数据集（未发布）
Lightblue自己的基于类别的数据集（未发布）
OASST（仅日语聊天数据）
ShareGPT（仅日语聊天数据）
augmxnt/ultra-orca-boros-en-ja-v1（仅['airoboros', 'slimorca', 'ultrafeedback', 'airoboros_ja_new']）