llama-2-70b-fb16-korean开源模型 - 免费支持韩语和英语文本生成

首页

Llama 2 70b Fb16 Korean

由 quantumaikr 开发

基于Llama2 70B模型在韩语数据集上微调的版本，专注于韩语和英语的文本生成任务

大型语言模型

Transformers

支持多种语言#韩语优化 #大参数模型 #指令跟随

下载量 127

发布时间 : 8/11/2023

模型简介

这是一个经过韩语数据集微调的大型语言模型，能够出色地遵循指令并提供帮助，特别适合韩语和英语的文本生成任务

模型特点

韩语优化

专门针对韩语进行了微调，提供更自然的韩语文本生成能力

大容量模型

基于70B参数的Llama2架构，具备强大的语言理解和生成能力

多语言支持

同时支持韩语和英语的文本生成

指令跟随

能够出色地理解和遵循用户指令

模型能力

韩语文本生成

英语文本生成

指令理解与执行

对话系统构建

使用案例

智能助手

韩语问答系统

构建能够理解并回答韩语问题的智能助手

提供准确、自然的韩语回答

内容创作

韩语内容生成

自动生成韩语文章、报告或其他文本内容

生成流畅、符合语境的韩语文本

🚀 quantumaikr/llama-2-70b-fb16-korean

quantumaikr/llama-2-70b-fb16-korean 是一个基于Llama2 70B模型，针对韩语数据集进行微调的模型，可用于文本生成。

KoreanLM icon

🚀 快速开始

使用以下代码片段即可开始与 quantumaikr/llama-2-70b-fb16-korean 进行对话：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

tokenizer = AutoTokenizer.from_pretrained("quantumaikr/llama-2-70b-fb16-korean")
model = AutoModelForCausalLM.from_pretrained("quantumaikr/llama-2-70b-fb16-korean", torch_dtype=torch.float16, device_map="auto")

system_prompt = "### System:\n귀하는 지시를 매우 잘 따르는 AI인 QuantumLM입니다. 최대한 많이 도와주세요. 안전에 유의하고 불법적인 행동은 하지 마세요.\n\n"

message = "인공지능이란 무엇인가요?"
prompt = f"{system_prompt}### User: {message}\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
output = model.generate(**inputs, do_sample=True, temperature=0.9, top_p=0.75, max_new_tokens=4096)

print(tokenizer.decode(output[0], skip_special_tokens=True))

💻 使用示例

基础用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

tokenizer = AutoTokenizer.from_pretrained("quantumaikr/llama-2-70b-fb16-korean")
model = AutoModelForCausalLM.from_pretrained("quantumaikr/llama-2-70b-fb16-korean", torch_dtype=torch.float16, device_map="auto")

system_prompt = "### System:\n귀하는 지시를 매우 잘 따르는 AI인 QuantumLM입니다. 최대한 많이 도와주세요. 안전에 유의하고 불법적인 행동은 하지 마세요.\n\n"

message = "인공지능이란 무엇인가요?"
prompt = f"{system_prompt}### User: {message}\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
output = model.generate(**inputs, do_sample=True, temperature=0.9, top_p=0.75, max_new_tokens=4096)

print(tokenizer.decode(output[0], skip_special_tokens=True))

高级用法

# 可以根据不同的需求调整生成参数，如调整温度、采样策略等，以获得不同风格的回复。
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

tokenizer = AutoTokenizer.from_pretrained("quantumaikr/llama-2-70b-fb16-korean")
model = AutoModelForCausalLM.from_pretrained("quantumaikr/llama-2-70b-fb16-korean", torch_dtype=torch.float16, device_map="auto")

system_prompt = "### System:\n귀하는 지시를 매우 잘 따르는 AI인 QuantumLM입니다. 최대한 많이 도와주세요. 안전에 유의하고 불법적인 행동은 하지 마세요.\n\n"

message = "인공지능이란 무엇인가요?"
prompt = f"{system_prompt}### User: {message}\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
# 调整生成参数
output = model.generate(**inputs, do_sample=True, temperature=0.7, top_p=0.8, max_new_tokens=2048)

print(tokenizer.decode(output[0], skip_special_tokens=True))

QuantumLM应使用以下提示格式：

### System:
This is a system prompt, please behave and help the user.

### User:
Your prompt here

### Assistant
The output of QuantumLM

📚 详细文档

使用与限制

预期用途

这些模型仅用于研究目的，需遵守 CC BY-NC 4.0 许可协议。

限制和偏差

尽管上述数据集有助于引导基础语言模型生成“更安全”的文本分布，但并非所有偏差和毒性都能通过微调来缓解。我们提醒用户注意生成回复中可能出现的此类潜在问题。请勿将模型输出视为人类判断的替代品或事实来源，请负责任地使用该模型。

⚠️ 重要提示

这些模型仅用于研究，需遵守 CC BY-NC 4.0 许可协议。

💡 使用建议

注意生成回复中可能存在的偏差和毒性问题，不要将模型输出作为人类判断的替代品，需负责任地使用。

联系我们：hi@quantumai.kr

属性	详情
模型类型	Llama2 70B模型针对韩语数据集微调
预期用途	仅用于研究，遵守 CC BY-NC 4.0 许可协议

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库