KULLM3-awq开源韩语大语言模型 - 高级指令跟随，流畅对话媲美GPT-3.5-turbo

首页

KULLM3 Awq

由 taeminlee 开发

KULLM3是一款具备高级指令跟随能力和流畅对话特性的韩语大语言模型，在韩语表现上与GPT-3.5-turbo接近。

大型语言模型

Transformers

支持多种语言#韩英双语对话 #指令跟随优化 #高丽大学研发

下载量 25

发布时间 : 4/8/2024

模型简介

基于SOLAR-10.7B微调的韩英双语大语言模型，专注于指令跟随和对话场景，由高丽大学NLP&AI实验室开发。

模型特点

卓越的韩语能力

在韩语理解和生成方面表现优异，是目前公开可用的最佳韩语模型之一

指令跟随能力

特别优化了指令跟随能力，表现接近GPT-3.5-turbo水平

伦理约束

内置伦理审查机制，拒绝生成不道德、违法或违背社会公序良俗的内容

模型能力

韩语文本生成

英语文本生成

多轮对话

指令理解与执行

使用案例

智能助手

韩语客服机器人

用于处理韩语客户咨询和服务请求

能够流畅自然地处理韩语对话

教育应用

韩语学习助手

帮助学习者练习韩语对话和写作

提供准确的韩语表达和语法指导

🚀 KULLM3 AWQ量化版本

本仓库是KULLM3的AWQ量化版本。该项目提供了一个基于特定模型进行量化处理后的版本，可借助特定框架运行，为用户提供了更高效的使用方式。

🚀 快速开始

量化操作是在 autoawq 的自定义分支中进行的。量化的超参数如下：

{ "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }

该量化版本使用 vllm 框架运行，由于未对其他框架进行测试，因此可能无法在其他框架中正常工作。

✨ 主要特性

KULLM3是一款具备先进指令遵循和流畅对话能力的模型。它在指令遵循方面表现出色，尤其在紧密跟随gpt - 3.5 - turbo方面表现突出。据我们所知，它是公开可用的最佳韩语语言模型之一。

📦 安装指南

安装依赖

pip install torch transformers==4.38.2 accelerate

⚠️ 重要提示

在transformers >= 4.39.0版本中，generate() 函数可能无法正常工作（截至2024年4月4日）。

💻 使用示例

基础用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

MODEL_DIR = "nlpai-lab/KULLM3"
model = AutoModelForCausalLM.from_pretrained(MODEL_DIR, torch_dtype=torch.float16).to("cuda")
tokenizer = AutoTokenizer.from_pretrained(MODEL_DIR)
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)

s = "고려대학교에 대해서 알고 있니?"
conversation = [{'role': 'user', 'content': s}]
inputs = tokenizer.apply_chat_template(
    conversation,
    tokenize=True,
    add_generation_prompt=True,
    return_tensors='pt').to("cuda")
_ = model.generate(inputs, streamer=streamer, max_new_tokens=1024)

# 네, 고려대학교에 대해 알고 있습니다. 고려대학교는 대한민국 서울에 위치한 사립 대학교로, 1905년에 설립되었습니다. 이 대학교는 한국에서 가장 오래된 대학 중 하나로, 다양한 학부 및 대학원 프로그램을 제공합니다. 고려대학교는 특히 법학, 경제학, 정치학, 사회학, 문학, 과학 분야에서 높은 명성을 가지고 있습니다. 또한, 스포츠 분야에서도 활발한 활동을 보이며, 대한민국 대학 스포츠에서 중요한 역할을 하고 있습니다. 고려대학교는 국제적인 교류와 협력에도 적극적이며, 전 세계 다양한 대학과의 협력을 통해 글로벌 경쟁력을 강화하고 있습니다.

📚 详细文档

模型描述

这是一个已发布在Hugging Face Hub上的🤗 transformers模型的卡片。

属性	详情
开发团队	NLP&AI Lab
支持语言	韩语、英语
许可证	CC - BY - NC 4.0
微调基础模型	upstage/SOLAR - 10.7B - Instruct - v1.0

训练详情

训练数据

vicgalle/alpaca - gpt4
混合韩语指令数据（GPT生成、手工制作等）
总共使用了约66000 + 个示例

训练过程

使用以下固定系统提示进行训练：

당신은 고려대학교 NLP&AI 연구실에서 만든 AI 챗봇입니다.
당신의 이름은 'KULLM'으로, 한국어로는 '구름'을 뜻합니다.
당신은 비도덕적이거나, 성적이거나, 불법적이거나 또는 사회 통념적으로 허용되지 않는 발언은 하지 않습니다.
사용자와 즐겁게 대화하며, 사용자의 응답에 가능한 정확하고 친절하게 응답함으로써 최대한 도와주려고 노력합니다.
질문이 이상하다면, 어떤 부분이 이상한지 설명합니다. 거짓 정보를 발언하지 않도록 주의합니다.

评估

评估详情（如测试数据、指标等）请参考 github。
如果不使用训练阶段的系统提示，KULLM的性能可能会低于预期。

评估结果

📄 许可证

本项目采用CC - BY - NC 4.0许可证。

📖 引用

@misc{kullm,
  author = {NLP & AI Lab and Human-Inspired AI research},
  title = {KULLM: Korea University Large Language Model Project},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/nlpai-lab/kullm}},
}