# 多輪指令微調

Meta Llama.llama 4 Scout 17B 16E Instruct GGUF
Llama 4 Scout 17B 16E Instruct 是一個基於Llama架構的大語言模型,專注於指令遵循任務,適用於多種文本生成場景。
大型語言模型
M
DevQuasar
3,012
2
Llama 4 Scout 17B 16E Instruct Q8 0
其他
Llama-4-Scout-17B-16E-Instruct 是一個由 Meta 發佈的大型語言模型,專注於指令遵循任務,適用於多種文本生成場景。
大型語言模型 Transformers
L
Mogith
385
0
Qwen2.5 0.5B Instruct Gensyn Swarm Peaceful Exotic Butterfly
基於Gensyn/Qwen2.5-0.5B-Instruct的微調版本,採用TRL框架和GRPO算法訓練,適用於指令跟隨任務。
大型語言模型 Transformers
Q
juliannode
16
2
Qwen2.5 Bakeneko 32b Instruct V2 Gguf
Apache-2.0
這是對rinna/qwen2.5-bakeneko-32b-instruct-v2使用llama.cpp進行量化的版本,兼容多種基於llama.cpp的應用。
大型語言模型 日語
Q
rinna
597
5
Meta Llama 3.1 8B Claude
Llama 3.1 8B Instruct是基於900萬Claude Opus/Sonnet tokens訓練完成的大語言模型,專注於指令理解和多輪對話任務。
大型語言模型 Transformers
M
Undi95
82
56
Meta Llama 3 8B Instruct Q4 K M GGUF
其他
Llama 3 8B 指令模型的 GGUF 量化版本,適用於本地推理,支持高效部署
大型語言模型 英語
M
NoelJacob
1,131
1
Mpt 30b Chat
MPT-30B-Chat 是由 MosaicML 開發的對話生成模型,基於 MPT-30B 在多個高質量對話數據集上微調而成,支持多輪對話和長上下文處理。
大型語言模型 Transformers 其他
M
mosaicml
1,502
203
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase