🚀 RefuelLLM-2-small(又名Llama-3-Refueled)
RefuelLLM-2-small是基於Llama3-8B基礎模型,在2750多個數據集上進行指令微調的模型。它可處理分類、閱讀理解、結構化屬性提取和實體解析等任務。我們很高興將該模型開源,供社區在此基礎上進行開發。
🚀 快速開始
本倉庫包含與HuggingFace兼容的Llama-3-Refueled模型權重。以下是使用Transformers庫的代碼示例:
>>> import torch
>>> from transformers import AutoModelForCausalLM, AutoTokenizer
>>> model_id = "refuelai/Llama-3-Refueled"
>>> tokenizer = AutoTokenizer.from_pretrained(model_id)
>>> model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16, device_map="auto")
>>> messages = [{"role": "user", "content": "Is this comment toxic or non-toxic: RefuelLLM is the new way to label text data!"}]
>>> inputs = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True).to("cuda")
>>> outputs = model.generate(inputs, max_new_tokens=20)
>>> print(tokenizer.decode(outputs[0]))
✨ 主要特性
- 多任務處理:能夠處理分類、閱讀理解、結構化屬性提取和實體解析等多種自然語言處理任務。
- 開源共享:模型開源,方便社區開發者在此基礎上進行二次開發。
📚 詳細文檔
模型詳情
- 模型開發者:Refuel AI
- 輸入:僅支持文本輸入。
- 輸出:僅輸出文本。
- 架構:基於Llama-3-8B-instruct構建,這是一個使用優化Transformer架構的自迴歸語言模型。
- 發佈日期:2024年5月8日。
- 許可證:CC BY-NC 4.0
訓練數據
該模型在超過40億個token上進行訓練,涵蓋2750多個自然語言處理任務。訓練數據集主要包括:
- 人工標註數據集,如Flan、Task Source和Aya集合。
- 合成數據集,如OpenOrca、OpenHermes和WizardLM。
- Refuel AI開發或授權的專有數據集。
基準測試
在本節中,我們報告了Refuel模型在標註任務基準測試中的結果。有關方法的詳細信息,請參閱此處。
提供商 |
模型 |
整體 |
分類 |
閱讀理解 |
結構提取 |
實體匹配 |
Refuel |
RefuelLLM-2 |
83.82% |
84.94% |
76.03% |
88.16% |
92.00% |
OpenAI |
GPT-4-Turbo |
80.88% |
81.77% |
72.08% |
84.79% |
97.20% |
Refuel |
RefuelLLM-2-small (Llama-3-Refueled) |
79.67% |
81.72% |
70.04% |
84.28% |
92.00% |
Anthropic |
Claude-3-Opus |
79.19% |
82.49% |
67.30% |
88.25% |
94.96% |
Meta |
Llama3-70B-Instruct |
78.20% |
79.38% |
66.03% |
85.96% |
94.13% |
Google |
Gemini-1.5-Pro |
74.59% |
73.52% |
60.67% |
84.27% |
98.48% |
Mistral |
Mixtral-8x7B-Instruct |
62.87% |
79.11% |
45.56% |
47.08% |
86.52% |
Anthropic |
Claude-3-Sonnet |
70.99% |
79.91% |
45.44% |
78.10% |
96.34% |
Anthropic |
Claude-3-Haiku |
69.23% |
77.27% |
50.19% |
84.97% |
54.08% |
OpenAI |
GPT-3.5-Turbo |
68.13% |
74.39% |
53.21% |
69.40% |
80.41% |
Meta |
Llama3-8B-Instruct |
62.30% |
68.52% |
49.16% |
65.09% |
63.61% |
侷限性
Llama-3-Refueled模型沒有任何審核機制。我們期待與社區合作,使該模型能夠更好地遵循規則,以便在需要審核輸出的環境中部署。
📄 許可證
本模型採用CC BY-NC 4.0許可證。