🚀 變換器庫項目
本項目基於變換器(transformers)庫,對模型進行微調訓練,旨在提供更優質的自然語言處理能力。通過特定的配置和訓練流程,讓模型在特定任務上表現更出色。
🚀 快速開始
本模型是 arcee-ai/Llama-3.1-SuperNova-Lite 在特定數據集上的微調版本。你可以參考以下配置和訓練流程來使用和理解本項目。

查看 Axolotl 配置
Axolotl 版本:0.4.1
base_model: arcee-ai/Llama-3.1-SuperNova-Lite
model_type: AutoModelForCausalLM
tokenizer_type: AutoTokenizer
load_in_8bit: false
load_in_4bit: false
strict: false
datasets:
- path: NewEden/CharacterAI-logs-sharegpt-Ngram-Cleaned
type: sharegpt
conversation: llama3
- path: NewEden/OpenCAI-ShareGPT
type: sharegpt
conversation: llama3
chat_template: llama3
output_dir: ./outputs
adapter:
lora_r:
lora_alpha:
lora_dropout:
lora_target_linear:
sequence_len: 16384
sample_packing: true
eval_sample_packing: false
pad_to_sequence_len: true
wandb_project: CAI-Supernova
wandb_entity:
wandb_watch:
wandb_name: CAI-Supernova-2
wandb_log_model:
plugins:
- axolotl.integrations.liger.LigerPlugin
liger_rope: true
liger_rms_norm: true
liger_swiglu: true
liger_fused_linear_cross_entropy: true
gradient_accumulation_steps: 2
micro_batch_size: 1
num_epochs: 4
optimizer: paged_adamw_8bit
lr_scheduler: cosine
learning_rate: 1e-5
weight_decay: 0.05
train_on_inputs: false
group_by_length: false
bf16: auto
fp16:
tf32: true
gradient_checkpointing: unsloth
early_stopping_patience:
resume_from_checkpoint:
local_rank:
logging_steps: 1
xformers_attention:
flash_attention: true
warmup_steps: 15
eval_table_size:
saves_per_epoch: 1
debug:
deepspeed: /workspace/axolotl/deepspeed_configs/zero3_bf16_cpuoffload_params.json
fsdp:
fsdp_config:
special_tokens:
pad_token: <|finetune_right_pad_id|>
eos_token: <|eot_id|>
📚 詳細文檔
模型描述
本模型是在 arcee-ai/Llama-3.1-SuperNova-Lite 基礎上進行微調的版本,更多詳細信息待補充。
預期用途與限制
關於本模型的預期用途和限制,更多詳細信息待補充。
訓練和評估數據
關於訓練和評估所使用的數據,更多詳細信息待補充。
訓練過程
訓練超參數
訓練過程中使用了以下超參數:
屬性 |
詳情 |
學習率 |
1e-05 |
訓練批次大小 |
1 |
評估批次大小 |
1 |
隨機種子 |
42 |
分佈式類型 |
多 GPU |
設備數量 |
4 |
梯度累積步數 |
2 |
總訓練批次大小 |
8 |
總評估批次大小 |
4 |
優化器 |
Adam(betas=(0.9, 0.999),epsilon=1e-08) |
學習率調度器類型 |
餘弦 |
學習率調度器熱身步數 |
15 |
訓練輪數 |
4 |
訓練結果
訓練結果相關信息待補充。
框架版本
- Transformers 4.44.2
- Pytorch 2.3.1+cu121
- Datasets 2.20.0
- Tokenizers 0.19.1
📄 許可證
本項目使用 llama3 許可證。