🚀 ZeroXClem-Llama-3.1-8B-AthenaSky-MegaMix
ZeroXClem-Llama-3.1-8B-AthenaSky-MegaMix 是一個強大的AI模型,它通過使用 MergeKit 進行 模型庫存合併 構建而成。該模型整合了 Hugging Face 上一些優秀的模型,確保在廣泛的自然語言處理(NLP)任務中表現出色,包括推理、編碼、角色扮演和指令遵循等。

此模型是通過合併高質量的基礎模型和微調模型創建的,形成了一個優化的 混合架構,保留了每個貢獻模型的優勢。
🚀 快速開始
🔥 Ollama(快速推理)
你可以使用 Ollama 運行該模型進行直接測試:
ollama run hf.co/ZeroXClem/Llama-3.1-8B-AthenaSky-MegaMix
🤗 Hugging Face Transformers(Python)
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import torch
model_name = "ZeroXClem/Llama-3.1-8B-AthenaSky-MegaMix"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype=torch.bfloat16,
device_map="auto"
)
text_generator = pipeline(
"text-generation",
model=model,
tokenizer=tokenizer,
torch_dtype=torch.bfloat16,
device_map="auto"
)
prompt = "Describe the significance of AI ethics in modern technology."
outputs = text_generator(
prompt,
max_new_tokens=200,
do_sample=True,
temperature=0.7,
top_k=50,
top_p=0.95
)
print(outputs[0]["generated_text"])
✨ 主要特性
🔹 高級推理與深思熟慮:由於集成了 Skywork-o1
,該模型在邏輯思維和問題解決方面表現出色。
🔹 增強的對話深度:包含 Meta-Llama-3.1-8B-Claude
使響應結構更好,在對話中更具吸引力。
🔹 多功能角色扮演與創造力:利用 mega_blend_model
和 good_mix_model_Stock
,該模型支持沉浸式角色扮演和講故事。
🔹 強大的指令遵循能力:在各種指令數據集上進行訓練,以提供清晰、信息豐富且有用的響應。
📦 安裝指南
文檔未提供具體安裝步驟,可參考快速開始部分的使用方法。
💻 使用示例
基礎用法
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import torch
model_name = "ZeroXClem/Llama-3.1-8B-AthenaSky-MegaMix"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype=torch.bfloat16,
device_map="auto"
)
text_generator = pipeline(
"text-generation",
model=model,
tokenizer=tokenizer,
torch_dtype=torch.bfloat16,
device_map="auto"
)
prompt = "Describe the significance of AI ethics in modern technology."
outputs = text_generator(
prompt,
max_new_tokens=200,
do_sample=True,
temperature=0.7,
top_k=50,
top_p=0.95
)
print(outputs[0]["generated_text"])
高級用法
文檔未提供高級用法示例。
📚 詳細文檔
合併詳情
合併的模型
以下模型為此次融合做出了貢獻:
配置
name: ZeroXClem-Llama-3.1-8B-AthenaSky-MegaMix
base_model: mergekit-community/L3.1-Athena-d-8B
dtype: bfloat16
merge_method: model_stock
models:
- model: Pedro13543/mega_blend_model
- model: Skywork/Skywork-o1-Open-Llama-3.1-8B
- model: Undi95/Meta-Llama-3.1-8B-Claude
- model: mergekit-community/good_mix_model_Stock
tokenizer_source: mergekit-community/L3.1-Athena-d-8B
使用場景
- 聊天與角色扮演:支持自然、引人入勝且動態的對話流程。
- 編程與代碼生成:提供可靠的代碼補全和調試建議。
- 創意寫作:生成引人入勝的故事、角色對話和沉浸式文本。
- 教育輔助:幫助解釋複雜主題並回答學術問題。
- 邏輯與問題解決:可以處理基於推理和結構化的思維過程。
模型評估結果
點擊查看Open LLM Leaderboard評估結果
詳細結果可在 此處 查看。
指標 |
值 |
平均值 |
26.79 |
IFEval(零樣本) |
63.01 |
BBH(3樣本) |
31.39 |
MATH Lvl 5(4樣本) |
27.95 |
GPQA(零樣本) |
3.69 |
MuSR(零樣本) |
6.90 |
MMLU - PRO(5樣本) |
27.82 |
🔧 技術細節
文檔未提供具體技術細節。
📄 許可證
本模型受 Meta Llama 3.1社區許可協議 約束。
⚠️ 重要提示
此模型未應用嚴格的審核機制。用戶在部署前應實施適當的 安全過濾器。
💡 使用建議
你需要對該模型生成的輸出負責。建議在將此模型集成到應用程序時應用 道德保障措施 和 內容審核機制。
ZeroXClem團隊 | 2025 