# 指令微調模型

Tngtech.olmo 2 Instruct Math 32B GGUF
OLMo-2-Instruct-Math-32B 是一個專注於數學任務的大型語言模型,由 tngtech 發佈。
大型語言模型
T
DevQuasar
272
1
Mistral Small 3.1 24b Instruct 2503 Jackterated GGUF
Apache-2.0
這是一個基於Mistral架構的24B參數規模的大型語言模型,支持文本生成任務,採用GGUF格式。
大型語言模型
M
JackCloudman
74
1
Mistral Small 3.1 24b Instruct 2503 Hf GGUF
這是一個基於mrfakename/mistral-small-3.1-24b-instruct-2503-hf模型的GGUF格式量化版本,適用於文本生成任務。
大型語言模型
M
MaziyarPanahi
137.78k
2
Writing Model Qwen 7B
Apache-2.0
基於Qwen2.5-7B-Instruct微調的寫作評估專用模型,使用12K規模SFT數據集訓練
大型語言模型 Transformers
W
AQuarterMile
72
3
Thedrummer Cydonia 24B V2.1 GGUF
其他
Cydonia-24B-v2.1是一個24B參數的大語言模型,經過llama.cpp的imatrix量化處理,提供多種量化版本以適應不同硬件需求。
大型語言模型
T
bartowski
4,417
7
Allenai.llama 3.1 Tulu 3.1 8B GGUF
Llama-3.1-Tulu-3.1-8B是由AllenAI開發的大語言模型,基於Llama架構,具有80億參數,專注於文本生成任務。
大型語言模型
A
DevQuasar
113
2
Nvidia AceInstruct 7B GGUF
基於英偉達AceInstruct-7B模型的量化版本,使用llama.cpp進行量化,支持多種量化類型,適用於代碼、數學和通用領域任務。
大型語言模型
N
bartowski
196
3
Smolvlm Instruct
Apache-2.0
基於HuggingFaceTB/SmolVLM-Instruct微調的智能視覺語言模型,採用Unsloth和TRL庫優化訓練速度
文本生成圖像 Transformers 英語
S
mjschock
18
2
Llama 3.3 70B Instruct FP8 Dynamic
Llama-3.3-70B-Instruct-FP8-dynamic 是經過優化的大語言模型,通過將激活和權重量化為 FP8 數據類型,減少了 GPU 內存需求並提高了計算吞吐量,支持多語言的商業和研究用途。
大型語言模型 Transformers 支持多種語言
L
RedHatAI
6,060
6
Chinese Text Correction 1.5b
Apache-2.0
Qwen2.5-1.5B-Instruct 是一個基於 Qwen2.5 架構的 15 億參數的中文指令微調模型,適用於文本生成和推理任務。
大型語言模型 Transformers 中文
C
shibing624
1,085
9
Solar Pro Preview Instruct GGUF
該項目提供了 upstage/solar-pro-preview-instruct 模型的 GGUF 格式文件,適用於文本生成任務。
大型語言模型
S
MaziyarPanahi
196.59k
26
Llama 3 8B Instruct
基於Llama-3-8B優化的北歐語言指令微調模型,支持瑞典語、丹麥語和挪威語
大型語言模型 Transformers 其他
L
AI-Sweden-Models
570
12
Llama 3 8B SFR Iterative DPO R
基於Llama-3-8B的指令優化模型,採用迭代式DPO強化學習訓練,在多項基準測試中超越同規模及部分大型模型
大型語言模型 Transformers
L
Salesforce
55
78
Mistral 7B OpenOrca Oasst Top1 2023 08 25 V3 Mistral 7B Instruct V0.1
Apache-2.0
這是一個基於Mistral-7B架構的融合模型,結合了Mistral-7B-Instruct和OpenOrca-oasst_top1兩個模型的優勢,專注於多語言文本生成任務。
大型語言模型 Transformers 支持多種語言
M
MaziyarPanahi
44
1
Mamba 2.8b Instruct Openhermes
這是一個基於OpenHermes數據集微調的28億參數MAMBA模型,採用新型狀態空間架構,擅長文本生成任務。
大型語言模型 Transformers 英語
M
clibrain
202
72
Gpt Sw3 20b Instruct 4bit Gptq
其他
GPT-SW3是由AI瑞典開發的大型北歐語言模型,支持5種北歐語言和英語的文本生成任務。
大型語言模型 Transformers 支持多種語言
G
AI-Sweden-Models
60
4
Pivot 0.1 Evil A
PiVoT-0.1-early 是基於 Mistral 7B 微調的模型,專注於文本生成任務,具有不同的變體版本以滿足不同實驗需求。
大型語言模型 Transformers 支持多種語言
P
maywell
478
46
H2ogpt Gm Oasst1 En 2048 Open Llama 3b
Apache-2.0
基於OpenAssistant/oasst1數據集微調的3B參數大語言模型,使用H2O LLM Studio訓練
大型語言模型 Transformers 英語
H
h2oai
139
3
Orca Mini 3b
orca_mini_3b是基於OpenLLaMa-3B模型訓練的文本生成模型,採用了來自WizardLM、Alpaca和Dolly-V2數據集的指令和輸入進行解釋性調優,並應用了Orca研究論文中的數據集構建方法。
大型語言模型 Transformers 英語
O
pankajmathur
4,232
161
H2ogpt Gm Oasst1 En 2048 Open Llama 7b Preview 700bt
Apache-2.0
基於OpenLlama 7B預訓練模型微調的大語言模型,使用OpenAssistant數據集訓練,支持英文文本生成任務
大型語言模型 Transformers 英語
H
h2oai
58
4
Lamini T5 738M
LaMini-T5-738M是基於t5-large在LaMini-instruction數據集上微調而成的指令微調模型,參數量為738M,屬於LaMini-LM系列模型之一。
大型語言模型 Transformers 英語
L
MBZUAI
2,966
49
Lamini Flan T5 783M
LaMini-Flan-T5-783M是基於google/flan-t5-large在LaMini-instruction數據集上微調的指令跟隨模型,參數量為783M,屬於LaMini-LM系列之一。
大型語言模型 Transformers 英語
L
MBZUAI
2,694
80
Lamini GPT 1.5B
LaMini-GPT-1.5B是基於GPT-2-xl架構微調的大型語言模型,屬於LaMini-LM系列,專注於指令跟隨任務
大型語言模型 Transformers 英語
L
MBZUAI
365
38
Gpt4 X Alpaca 13b Native 4bit 128g
基於GPT4和Alpaca指令微調的13B參數語言模型,支持4bit量化推理
大型語言模型 Transformers
G
anon8231489123
344
736
Alpaca 7b
該倉庫包含一個基於斯坦福Alpaca數據集內部調優的LLaMA-7b模型,主要用於機器翻譯研究。
大型語言模型 Transformers
A
wxjiao
387
12
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase