Llama-3-Open-Ko-8B-gguf开源韩语语言模型 - 海量数据训练助力语言交互

首页

Llama 3 Open Ko 8B Gguf

由 teddylee777 开发

基于Llama-3-8B框架继续预训练的韩语语言模型，使用超过60GB去重文本数据训练

大型语言模型支持多种语言#韩语优化 #多轮对话 #长文本生成

下载量 7,211

发布时间 : 4/24/2024

模型简介

Llama-3-Open-Ko-8B是基于Llama-3-8B框架继续预训练的语言模型，专注于韩语文本生成和理解

模型特点

韩语优化

专门针对韩语进行预训练，使用新的Llama-3分词器处理超过177亿标记

长上下文支持

支持8k的上下文长度，适合处理长文本任务

高效推理

采用GQA(Grouped Query Attention)技术提高推理效率

模型能力

韩语文本生成

英语文本生成

代码生成

对话系统

使用案例

对话系统

智能助手

构建韩语智能对话助手

提供有帮助、详细且礼貌的回答

内容生成

韩语内容创作

生成韩语文章、故事等内容

🚀 Llama-3-Open-Ko-8B 模型

Llama-3-Open-Ko-8B 是基于 Llama-3-8B 框架的持续预训练语言模型，使用超 60GB 公开文本资源训练，在多自然语言生成任务中表现出色。

🚀 快速开始

Ollama 配置

Modelfile 配置如下：

FROM Llama-3-Open-Ko-8B-Q8_0.gguf

TEMPLATE """{{- if .System }}
<s>{{ .System }}</s>
{{- end }}
<s>Human:
{{ .Prompt }}</s>
<s>Assistant:
"""

SYSTEM """A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions."""

PARAMETER temperature 0
PARAMETER num_predict 3000
PARAMETER num_ctx 4096
PARAMETER stop <s>
PARAMETER stop </s>

⚠️ 重要提示

2024 年 4 月 24 日更新：发布 Llama-3-Open-Ko-8B 模型和 Llama-3-Open-Ko-8B-Instruct-preview。

✨ 主要特性

原始模型为 beomi/Llama-3-Open-Ko-8B。
使用 llama.cpp 进行量化。

📚 详细文档

模型详情

Llama-3-Open-Ko-8B

Llama-3-Open-Ko-8B 模型是基于 Llama-3-8B 框架的持续预训练语言模型。该模型使用了超过 60GB 来自公开资源的去重文本进行训练。借助新的 Llama-3 分词器，该模型进行了超过 177 亿个标记的预训练，略多于 Llama-2 的韩语分词器处理的标记数量。训练在 Google 的 TRC 计划支持的 TPUv5e - 256 上进行。

Llama-3-Open-Ko-8B-Instruct-preview

指令模型 Llama-3-Open-Ko-8B-Instruct-preview 融入了 Chat Vector 论文的概念。此模型为预览版，尚未使用任何韩语指令集进行微调，是开发新的聊天和指令模型的良好起点。

Meta Llama-3

由 Meta 开发和发布的 Meta Llama 3 系列大语言模型（LLMs）针对对话用例进行了优化，在常见的行业基准测试中表现出色，强调了实用性和安全性。

模型开发者：Junbum Lee（Beomi）

变体：Llama-3-Open-Ko 有 8B 一种配置。

输入/输出：模型接受文本输入，生成文本和代码。

模型架构：Llama 3 使用了优化的 Transformer 架构。

属性	详情
模型类型	Llama-3-Open-Ko
训练数据	与 Open-Solar-Ko 数据集相同
参数数量	8B
上下文长度	8k
GQA	是
标记数量	177 亿以上
知识截止日期	2023 年 6 月

*数据集列表可在此处查看

预期用途

商业和研究应用

Llama 3 设计用于英语，其指令微调模型适用于类似助手的聊天场景，而预训练模型则可用于各种自然语言生成任务。

超出范围

禁止任何违反适用法律、法规、可接受使用政策和 Llama 3 社区许可的使用。

责任与安全

Meta 对负责任人工智能的承诺包括采取措施限制滥用和危害，同时支持开源社区。鼓励开发者实施安全最佳实践，并使用 Meta Llama Guard 2 和 Code Shield 等资源，以满足其特定用例的安全需求。

负责任发布

我们遵循严格的防滥用流程，确保遵守所有安全和道德准则，详情见我们的负责任使用指南。

伦理考量和局限性

Llama 3 基于开放、包容和实用的原则构建，旨在适用于不同背景和用例。开发者在部署前应针对特定应用进行全面的安全测试和调整。

引用说明

Llama-3-Open-Ko

@article{llama3openko,
  title={Llama-3-Open-Ko},
  author={L, Junbum},
  year={2024},
  url={https://huggingface.co/beomi/Llama-3-Open-Ko-8B}
}

原始 Llama-3

@article{llama3modelcard,
  title={Llama 3 Model Card},
  author={AI@Meta},
  year={2024},
  url = {https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md}
}