koOpenChat-sft开源韩语对话模型 - 支持两种格式指令交互畅聊无阻

首页

Koopenchat Sft

由 maywell 开发

koOpenChat-sft是基于OpenChat3.5优化的韩语对话模型，支持ChatML和Alpaca格式的指令交互。

大型语言模型

Transformers

#韩语对话优化 #ChatML兼容 #多轮对话

下载量 1,836

发布时间 : 11/14/2023

模型简介

这是一个针对韩语优化的对话模型，基于OpenChat3.5进行微调，适用于韩语对话生成任务。

模型特点

韩语优化

专门针对韩语对话进行了优化和微调

多格式支持

支持ChatML和Alpaca两种指令格式

开源许可

采用cc-by-sa-4.0开源许可证

模型能力

韩语对话生成

指令跟随

文本生成

使用案例

对话系统

韩语聊天机器人

用于构建韩语对话机器人

教育

韩语学习助手

帮助学习者练习韩语对话

🚀 koOpenChat - sft🐧

koOpenChat - sft是一个基于特定技术开发的模型，它在相关领域有着独特的应用价值，能为用户提供特定场景下的服务。

🚀 快速开始

如果你想使用koOpenChat - sft模型，可以参考下面的代码示例。

from transformers import AutoModelForCausalLM, AutoTokenizer

device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained("maywell/koOpenChat-sft")
tokenizer = AutoTokenizer.from_pretrained("maywell/koOpenChat-sft")

messages = [
    {"role": "user", "content": "바나나는 원래 하얀색이야?"},
]

encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")

model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(model_inputs, max_new_tokens=1000, do_sample=True)
decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])

✨ 主要特性

该模型基于OpenChat3.5基础模型进行训练。
遵循[ChatML](https://github.com/openai/openai - python/blob/main/chatml.md)格式和**Alpaca(No - Input)**格式。

📦 安装指南

文档未提及具体安装步骤，暂无法提供。

💻 使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer

device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained("maywell/koOpenChat-sft")
tokenizer = AutoTokenizer.from_pretrained("maywell/koOpenChat-sft")

messages = [
    {"role": "user", "content": "바나나는 원래 하얀색이야?"},
]

encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")

model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(model_inputs, max_new_tokens=1000, do_sample=True)
decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])

📚 详细文档

模型详情

属性	详情
基础模型	OpenChat3.5
训练设备	A100 80GB * 1
指令格式	遵循[ChatML](https://github.com/openai/openai - python/blob/main/chatml.md)格式和Alpaca(No - Input)格式

模型评估结果

详细结果可查看[此处](https://huggingface.co/datasets/open - llm - leaderboard/details_maywell__koOpenChat - sft)

指标	值
平均值	51.36
ARC (25 - shot)	59.81
HellaSwag (10 - shot)	78.73
MMLU (5 - shot)	61.32
TruthfulQA (0 - shot)	51.24
Winogrande (5 - shot)	76.4
GSM8K (5 - shot)	24.18
DROP (3 - shot)	7.82