🚀 ZeroXClem-Llama-3.1-8B-AthenaSky-MegaMix
ZeroXClem-Llama-3.1-8B-AthenaSky-MegaMix 是一个强大的AI模型,它通过使用 MergeKit 进行 模型库存合并 构建而成。该模型整合了 Hugging Face 上一些优秀的模型,确保在广泛的自然语言处理(NLP)任务中表现出色,包括推理、编码、角色扮演和指令遵循等。

此模型是通过合并高质量的基础模型和微调模型创建的,形成了一个优化的 混合架构,保留了每个贡献模型的优势。
🚀 快速开始
🔥 Ollama(快速推理)
你可以使用 Ollama 运行该模型进行直接测试:
ollama run hf.co/ZeroXClem/Llama-3.1-8B-AthenaSky-MegaMix
🤗 Hugging Face Transformers(Python)
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import torch
model_name = "ZeroXClem/Llama-3.1-8B-AthenaSky-MegaMix"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype=torch.bfloat16,
device_map="auto"
)
text_generator = pipeline(
"text-generation",
model=model,
tokenizer=tokenizer,
torch_dtype=torch.bfloat16,
device_map="auto"
)
prompt = "Describe the significance of AI ethics in modern technology."
outputs = text_generator(
prompt,
max_new_tokens=200,
do_sample=True,
temperature=0.7,
top_k=50,
top_p=0.95
)
print(outputs[0]["generated_text"])
✨ 主要特性
🔹 高级推理与深思熟虑:由于集成了 Skywork-o1
,该模型在逻辑思维和问题解决方面表现出色。
🔹 增强的对话深度:包含 Meta-Llama-3.1-8B-Claude
使响应结构更好,在对话中更具吸引力。
🔹 多功能角色扮演与创造力:利用 mega_blend_model
和 good_mix_model_Stock
,该模型支持沉浸式角色扮演和讲故事。
🔹 强大的指令遵循能力:在各种指令数据集上进行训练,以提供清晰、信息丰富且有用的响应。
📦 安装指南
文档未提供具体安装步骤,可参考快速开始部分的使用方法。
💻 使用示例
基础用法
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import torch
model_name = "ZeroXClem/Llama-3.1-8B-AthenaSky-MegaMix"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype=torch.bfloat16,
device_map="auto"
)
text_generator = pipeline(
"text-generation",
model=model,
tokenizer=tokenizer,
torch_dtype=torch.bfloat16,
device_map="auto"
)
prompt = "Describe the significance of AI ethics in modern technology."
outputs = text_generator(
prompt,
max_new_tokens=200,
do_sample=True,
temperature=0.7,
top_k=50,
top_p=0.95
)
print(outputs[0]["generated_text"])
高级用法
文档未提供高级用法示例。
📚 详细文档
合并详情
合并的模型
以下模型为此次融合做出了贡献:
配置
name: ZeroXClem-Llama-3.1-8B-AthenaSky-MegaMix
base_model: mergekit-community/L3.1-Athena-d-8B
dtype: bfloat16
merge_method: model_stock
models:
- model: Pedro13543/mega_blend_model
- model: Skywork/Skywork-o1-Open-Llama-3.1-8B
- model: Undi95/Meta-Llama-3.1-8B-Claude
- model: mergekit-community/good_mix_model_Stock
tokenizer_source: mergekit-community/L3.1-Athena-d-8B
使用场景
- 聊天与角色扮演:支持自然、引人入胜且动态的对话流程。
- 编程与代码生成:提供可靠的代码补全和调试建议。
- 创意写作:生成引人入胜的故事、角色对话和沉浸式文本。
- 教育辅助:帮助解释复杂主题并回答学术问题。
- 逻辑与问题解决:可以处理基于推理和结构化的思维过程。
模型评估结果
点击查看Open LLM Leaderboard评估结果
详细结果可在 此处 查看。
指标 |
值 |
平均值 |
26.79 |
IFEval(零样本) |
63.01 |
BBH(3样本) |
31.39 |
MATH Lvl 5(4样本) |
27.95 |
GPQA(零样本) |
3.69 |
MuSR(零样本) |
6.90 |
MMLU - PRO(5样本) |
27.82 |
🔧 技术细节
文档未提供具体技术细节。
📄 许可证
本模型受 Meta Llama 3.1社区许可协议 约束。
⚠️ 重要提示
此模型未应用严格的审核机制。用户在部署前应实施适当的 安全过滤器。
💡 使用建议
你需要对该模型生成的输出负责。建议在将此模型集成到应用程序时应用 道德保障措施 和 内容审核机制。
ZeroXClem团队 | 2025 