Qarasu-14B-chat-plus-unleashed開源對話模型 - 支持日英雙語高質量交流

首頁

Qarasu 14B Chat Plus Unleashed

由lightblue開發

Qarasu是基於Qwen-14B-Chat微調的日語和英語對話模型，在MT-Bench基準測試中表現優異。

大型語言模型

Transformers

支持多種語言開源協議:其他 #日語英語雙語 #聊天助手優化 #大語言模型14B

下載量 51

發布時間 : 12/22/2023

模型概述

Qarasu是一個基於Qwen-14B-Chat微調的多語言對話模型，專注於日語和英語交流，適用於AI助手等場景。

模型特點

多語言支持

專注於日語和英語對話，適合雙語應用場景

高質量微調

基於約70億條高質量數據進行微調，過濾了低質量回答

優異基準表現

在MT-Bench基準測試中表現突出

模型能力

日語對話生成

英語對話生成

多輪對話處理

問答系統

使用案例

AI助手

日語問答助手

回答用戶關於各種主題的日語問題

示例中正確回答了關於英國首相的問題

客戶服務

雙語客服機器人

處理日語和英語客戶的諮詢

🚀 Qwen/Qwen-14B-Chat + Karasu微調數據集項目

本項目基於Qwen/Qwen-14B-Chat模型，結合Karasu的微調數據集，在特定任務上展現出了優秀的性能。

drawing

🚀 快速開始

模型演示

模型演示鏈接

博客文章

相關說明文章

✨ 主要特性

在內部評估中，發現Qarasu模型在MT - Bench基準測試中表現出了特別高的性能，目前正在等待外部評估結果。

📦 安裝指南

此部分文檔未提供具體安裝步驟，暫不展示。

💻 使用示例

基礎用法

Huggingface使用示例

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("lightblue/qarasu-14B-chat-plus-unleashed", torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True)

pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)

messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか？"})

prompt = tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)

pipe(prompt, max_new_tokens=100, do_sample=False, temperature=0.0, return_full_text=False)

VLLM使用示例

from vllm import LLM, SamplingParams

sampling_params = SamplingParams(temperature=0.0, max_tokens=100)
llm = LLM(model="lightblue/qarasu-14B-chat-plus-unleashed", trust_remote_code=True)

messages = [{"role": "system", "content": "あなたはAIアシスタントです。"}]
messages.append({"role": "user", "content": "イギリスの首相は誰ですか？"})
prompt = llm.llm_engine.tokenizer.apply_chat_template(conversation=messages, add_generation_prompt=True, tokenize=False)
prompts = [prompt]

outputs = llm.generate(prompts, sampling_params)
for output in outputs:
    prompt = output.prompt
    generated_text = output.outputs[0].text
    print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")

📚 詳細文檔

基礎模型

Qwen/Qwen-14B-Chat

訓練數據集（總計約7B）

與“plus”檢查點相同，但從類別數據集中過濾掉了約6K條拒絕回覆（“申し訳ありませんが、。。。”）

Lightblue的Kujira數據集套件（未發佈）
Lightblue自己的基於問題的數據集（未發佈）
Lightblue自己的基於類別的數據集（未發佈）
OASST（僅日語聊天數據）
ShareGPT（僅日語聊天數據）
augmxnt/ultra-orca-boros-en-ja-v1（僅['airoboros', 'slimorca', 'ultrafeedback', 'airoboros_ja_new']）