koOpenChat-sft開源韓語對話模型 - 支持兩種格式指令交互暢聊無阻

首頁

Koopenchat Sft

由maywell開發

koOpenChat-sft是基於OpenChat3.5優化的韓語對話模型，支持ChatML和Alpaca格式的指令交互。

大型語言模型

Transformers

#韓語對話優化 #ChatML兼容 #多輪對話

下載量 1,836

發布時間 : 11/14/2023

模型概述

這是一個針對韓語優化的對話模型，基於OpenChat3.5進行微調，適用於韓語對話生成任務。

模型特點

韓語優化

專門針對韓語對話進行了優化和微調

多格式支持

支持ChatML和Alpaca兩種指令格式

開源許可

採用cc-by-sa-4.0開源許可證

模型能力

韓語對話生成

指令跟隨

文本生成

使用案例

對話系統

韓語聊天機器人

用於構建韓語對話機器人

教育

韓語學習助手

幫助學習者練習韓語對話

🚀 koOpenChat - sft🐧

koOpenChat - sft是一個基於特定技術開發的模型，它在相關領域有著獨特的應用價值，能為用戶提供特定場景下的服務。

🚀 快速開始

如果你想使用koOpenChat - sft模型，可以參考下面的代碼示例。

from transformers import AutoModelForCausalLM, AutoTokenizer

device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained("maywell/koOpenChat-sft")
tokenizer = AutoTokenizer.from_pretrained("maywell/koOpenChat-sft")

messages = [
    {"role": "user", "content": "바나나는 원래 하얀색이야?"},
]

encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")

model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(model_inputs, max_new_tokens=1000, do_sample=True)
decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])

✨ 主要特性

該模型基於OpenChat3.5基礎模型進行訓練。
遵循[ChatML](https://github.com/openai/openai - python/blob/main/chatml.md)格式和**Alpaca(No - Input)**格式。

📦 安裝指南

文檔未提及具體安裝步驟，暫無法提供。

💻 使用示例

基礎用法

from transformers import AutoModelForCausalLM, AutoTokenizer

device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained("maywell/koOpenChat-sft")
tokenizer = AutoTokenizer.from_pretrained("maywell/koOpenChat-sft")

messages = [
    {"role": "user", "content": "바나나는 원래 하얀색이야?"},
]

encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")

model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(model_inputs, max_new_tokens=1000, do_sample=True)
decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])

📚 詳細文檔

模型詳情

屬性	詳情
基礎模型	OpenChat3.5
訓練設備	A100 80GB * 1
指令格式	遵循[ChatML](https://github.com/openai/openai - python/blob/main/chatml.md)格式和Alpaca(No - Input)格式

模型評估結果

詳細結果可查看[此處](https://huggingface.co/datasets/open - llm - leaderboard/details_maywell__koOpenChat - sft)

指標	值
平均值	51.36
ARC (25 - shot)	59.81
HellaSwag (10 - shot)	78.73
MMLU (5 - shot)	61.32
TruthfulQA (0 - shot)	51.24
Winogrande (5 - shot)	76.4
GSM8K (5 - shot)	24.18
DROP (3 - shot)	7.82