🚀 Llama-3-Open-Ko-8B 模型
Llama-3-Open-Ko-8B 是基于 Llama-3-8B 框架的持续预训练语言模型,使用超 60GB 公开文本资源训练,在多自然语言生成任务中表现出色。
🚀 快速开始
Ollama 配置
Modelfile 配置如下:
FROM Llama-3-Open-Ko-8B-Q8_0.gguf
TEMPLATE """{{- if .System }}
<s>{{ .System }}</s>
{{- end }}
<s>Human:
{{ .Prompt }}</s>
<s>Assistant:
"""
SYSTEM """A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions."""
PARAMETER temperature 0
PARAMETER num_predict 3000
PARAMETER num_ctx 4096
PARAMETER stop <s>
PARAMETER stop </s>
⚠️ 重要提示
2024 年 4 月 24 日更新:发布 Llama-3-Open-Ko-8B 模型和 Llama-3-Open-Ko-8B-Instruct-preview。
✨ 主要特性
📚 详细文档
模型详情
Llama-3-Open-Ko-8B
Llama-3-Open-Ko-8B 模型是基于 Llama-3-8B 框架的持续预训练语言模型。该模型使用了超过 60GB 来自公开资源的去重文本进行训练。借助新的 Llama-3 分词器,该模型进行了超过 177 亿个标记的预训练,略多于 Llama-2 的韩语分词器处理的标记数量。训练在 Google 的 TRC 计划支持的 TPUv5e - 256 上进行。
Llama-3-Open-Ko-8B-Instruct-preview
指令模型 Llama-3-Open-Ko-8B-Instruct-preview 融入了 Chat Vector 论文 的概念。此模型为预览版,尚未使用任何韩语指令集进行微调,是开发新的聊天和指令模型的良好起点。
Meta Llama-3
由 Meta 开发和发布的 Meta Llama 3 系列大语言模型(LLMs)针对对话用例进行了优化,在常见的行业基准测试中表现出色,强调了实用性和安全性。
模型开发者:Junbum Lee(Beomi)
变体:Llama-3-Open-Ko 有 8B 一种配置。
输入/输出:模型接受文本输入,生成文本和代码。
模型架构:Llama 3 使用了优化的 Transformer 架构。
属性 |
详情 |
模型类型 |
Llama-3-Open-Ko |
训练数据 |
与 Open-Solar-Ko 数据集相同 |
参数数量 |
8B |
上下文长度 |
8k |
GQA |
是 |
标记数量 |
177 亿以上 |
知识截止日期 |
2023 年 6 月 |
*数据集列表可在 此处 查看
预期用途
商业和研究应用
Llama 3 设计用于英语,其指令微调模型适用于类似助手的聊天场景,而预训练模型则可用于各种自然语言生成任务。
超出范围
禁止任何违反适用法律、法规、可接受使用政策和 Llama 3 社区许可的使用。
责任与安全
Meta 对负责任人工智能的承诺包括采取措施限制滥用和危害,同时支持开源社区。鼓励开发者实施安全最佳实践,并使用 Meta Llama Guard 2 和 Code Shield 等资源,以满足其特定用例的安全需求。
负责任发布
我们遵循严格的防滥用流程,确保遵守所有安全和道德准则,详情见我们的 负责任使用指南。
伦理考量和局限性
Llama 3 基于开放、包容和实用的原则构建,旨在适用于不同背景和用例。开发者在部署前应针对特定应用进行全面的安全测试和调整。
引用说明
Llama-3-Open-Ko
@article{llama3openko,
title={Llama-3-Open-Ko},
author={L, Junbum},
year={2024},
url={https://huggingface.co/beomi/Llama-3-Open-Ko-8B}
}
原始 Llama-3
@article{llama3modelcard,
title={Llama 3 Model Card},
author={AI@Meta},
year={2024},
url = {https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md}
}
许可证
本模型使用的许可证为 llama3,许可证名称为 llama3,许可证链接为 https://llama.meta.com/llama3/license。