# 指令微調

Tencent.hunyuan A13B Instruct GGUF
騰訊混元A13B指令模型的量化版本,通過技術手段在保證性能的同時提升運行效率。
大型語言模型
T
DevQuasar
402
1
Gemma 3n E2B It Unsloth Bnb 4bit
Gemma 3n-E2B-it 是 Google 推出的輕量級開源多模態模型,基於與 Gemini 相同技術構建,專為低資源設備優化。
圖像生成文本 Transformers 英語
G
unsloth
4,914
2
Gryphe Codex 24B Small 3.2 GGUF
Apache-2.0
這是Gryphe的Codex-24B-Small-3.2模型的量化版本,通過量化技術優化了在不同硬件條件下的運行效率。
大型語言模型 英語
G
bartowski
626
3
Gemma 3n E4B It
Gemma 3n是Google推出的輕量級、最先進的開源多模態模型家族,基於與Gemini模型相同的研究和技術構建,支持文本、音頻和視覺輸入。
圖像生成文本 Transformers
G
google
1,690
81
Fanar 1 9B Instruct
Apache-2.0
Fanar-1-9B-Instruct 是一款強大的阿拉伯語 - 英語大語言模型,由卡塔爾計算研究機構(QCRI)開發,支持現代標準阿拉伯語及多種阿拉伯方言,並與伊斯蘭價值觀和阿拉伯文化保持一致。
大型語言模型 Transformers 支持多種語言
F
QCRI
115
1
Kakaocorp.kanana 1.5 8b Instruct 2505 GGUF
Kanana-1.5-8B-Instruct-2505 是由 Kakao Corp 開發的一個 8B 參數規模的指令微調語言模型,適用於文本生成任務。
大型語言模型
K
DevQuasar
483
1
Marin Community.marin 8b Instruct GGUF
marin-8b-instruct 是一個 8B 參數規模的指令微調語言模型,適用於文本生成任務。
大型語言模型
M
DevQuasar
343
1
Seed Coder 8B Instruct GGUF
MIT
Seed-Coder-8B-Instruct 是一款強大的開源代碼模型,具有以模型為中心、透明和高性能等特點,在多種編碼任務中表現出色。
大型語言模型 Transformers
S
unsloth
3,391
1
Qwen2.5 1.5B S1k 1.1
該模型是基於Qwen/Qwen2.5-1.5B-Instruct微調而來的文本生成模型,使用TRL進行訓練,為文本生成任務提供了強大的支持。
大型語言模型 Transformers
Q
rvindra
1,312
1
Spatial LLaVA 7B Gguf
Apache-2.0
Spatial-LLaVA-7B是基於LLaVA模型微調的多模態模型,專注於提升空間關係推理能力,適用於多模態研究和聊天機器人開發。
文本生成圖像 Safetensors
S
rogerxi
252
1
Gryphe Pantheon Proto RP 1.8 30B A3B GGUF
Apache-2.0
這是一個基於Gryphe/Pantheon-Proto-RP-1.8-30B-A3B模型的量化版本,使用llama.cpp進行量化,適用於角色扮演和文本生成任務。
大型語言模型 英語
G
bartowski
2,972
6
Bielik 4.5B V3.0 Instruct FP8 Dynamic
Apache-2.0
該模型是Bielik-4.5B-v3.0-Instruct的FP8量化版本,通過AutoFP8技術將權重和激活量化為FP8數據類型,減少約50%的磁盤空間和GPU內存需求。
大型語言模型 其他
B
speakleash
74
1
Bielik 1.5B V3.0 Instruct FP8 Dynamic
Apache-2.0
這是一個基於Bielik-1.5B-v3.0-Instruct模型的FP8動態量化版本,適配vLLM或SGLang推理框架,通過AutoFP8量化技術將參數字節數從16位降至8位,顯著降低磁盤空間和GPU顯存需求。
大型語言模型 其他
B
speakleash
31
1
Bielik 1.5B V3.0 Instruct GGUF
Apache-2.0
這是一個波蘭語的1.5B參數指令微調模型,基於SpeakLeash的Bielik系列開發,適用於文本生成任務。
大型語言模型 其他
B
speakleash
341
3
Allenai.olmo 2 0425 1B Instruct GGUF
OLMo-2-0425-1B-Instruct是由AllenAI開發的一個10億參數規模的指令微調語言模型,專注於文本生成任務。
大型語言模型
A
DevQuasar
220
1
Olmo 2 0425 1B Instruct GGUF
Apache-2.0
OLMo 2 1B指令版是基於OLMo-2-0425-1B-RLVR1模型的後訓練變體,經過監督微調、DPO訓練和RLVR訓練,旨在實現多種任務的最先進性能。
大型語言模型 英語
O
unsloth
3,137
3
Smollm 135M Instruct
Apache-2.0
一個輕量級指令微調語言模型,專為移動端部署優化
大型語言模型
S
litert-community
131
1
Josiefied Qwen3 4B Abliterated V1 Gguf
Apache-2.0
這是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本,適用於本地部署和運行。
大型語言模型
J
Goekdeniz-Guelmez
4,518
7
Olmo 2 0425 1B Instruct
Apache-2.0
OLMo 2 1B是基於allenai/OLMo-2-0425-1B-RLVR1模型的後訓練變體,經過監督微調、DPO訓練和RLVR訓練,旨在實現多種任務的最先進性能。
大型語言模型 Transformers 英語
O
allenai
5,127
33
Industry Project V2
Apache-2.0
基於Mistral架構優化的指令微調模型,適用於零樣本分類任務
大型語言模型
I
omsh97
58
0
Stablelm Zephyr 3b GGUF
其他
StableLM Zephyr 3B是一個30億參數的指令調優模型,基於公開數據集、合成數據集和直接偏好優化(DPO)訓練,性能表現優異。
大型語言模型 英語
S
brittlewis12
51
1
Gemma 2 9b It Abliterated GGUF
基於Gemma 2.9B的量化版本,使用llama.cpp進行優化,適合在LM Studio中運行。
大型語言模型 英語
G
bartowski
3,941
37
Aya 23 8B
Aya-23是一個開放權重的指令微調模型研究版本,具有高度先進的多語言能力,支持23種語言。
大型語言模型 Transformers 支持多種語言
A
CohereLabs
10.28k
415
Llama Krikri 8B Instruct
Llama-Krikri-8B-Instruct是由雅典娜研究中心開發的希臘語指令調優大語言模型,基於Llama-3.1-8B構建,增強了希臘語和英語的多任務處理能力。
大型語言模型 Transformers 支持多種語言
L
ilsp
1,630
18
Badger Writer Llama 3 8b
Badger Writer 是基於多個 Llama 3 8B 模型的歸一化傅里葉任務疊加模型,專注於文本生成任務,特別擅長創意寫作和指令跟隨。
大型語言模型 Transformers
B
maldv
106
10
MKLLM 7B Instruct
MKLLM-7B是一款面向馬其頓語的開源大語言模型,基於Mistral-7B-v0.1模型通過持續預訓練馬其頓語和英語混合文本構建而成。
大型語言模型 Transformers 支持多種語言
M
trajkovnikola
31
8
Gemma 2 Llama Swallow 27b It V0.1
基於Gemma-2架構的日語增強大語言模型,通過持續預訓練顯著提升日語能力,同時保留原版英語能力
大型語言模型 Transformers 支持多種語言
G
tokyotech-llm
27
1
Gemma 2 Llama Swallow 9b It V0.1
Gemma-2-Llama-Swallow系列模型是在Gemma-2基礎上進行持續預訓練構建的多語言大模型,特別增強了日語能力。
大型語言模型 Transformers 支持多種語言
G
tokyotech-llm
2,491
3
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通過對gemma-2模型進行持續預訓練構建的,顯著增強了日文語言處理能力,同時保留原有英文能力。
大型語言模型 Transformers 支持多種語言
G
tokyotech-llm
61
1
Turkish Gemma 9b V0.1
Turkish-Gemma-9b-v0.1是基於Gemma-2-9b開發的土耳其語文本生成模型,通過持續預訓練、監督微調(SFT)、直接偏好優化(DPO)和模型合併技術優化而成。
大型語言模型 Safetensors
T
ytu-ce-cosmos
167
18
Bielik 4.5B V3.0 Instruct
Apache-2.0
Bielik-4.5B-v3-Instruct是一款擁有46億參數的波蘭語生成式文本模型,基於Bielik-4.5B-v3進行指令微調,展現出卓越的波蘭語理解和處理能力。
大型語言模型 Transformers 其他
B
speakleash
1,121
13
Olmo 2 0425 1B
Apache-2.0
OLMo 2 1B是艾倫人工智能研究所推出的開放語言模型系列中最小的模型,基於OLMo-mix-1124預訓練,並在中期訓練階段使用Dolmino-mix-1124數據集。
大型語言模型 Transformers 英語
O
allenai
13.31k
45
Falcon E 1B Instruct
其他
Falcon-E-1B-Instruct 是一個基於1.58比特架構的高效語言模型,專為邊緣設備優化,具有低內存佔用和高性能的特點。
大型語言模型 Transformers
F
tiiuae
87
7
Qwen2.5 Recursive Coder 14B Instruct
Apache-2.0
基於Qwen2.5架構的14B參數規模代碼生成與理解模型,通過Model Stock方法融合多個專業編碼模型而成
大型語言模型 Transformers
Q
spacematt
39
2
Videochat R1 Thinking 7B
Apache-2.0
VideoChat-R1-thinking_7B 是一個基於 Qwen2.5-VL-7B-Instruct 的多模態模型,專注於視頻文本轉文本任務。
視頻生成文本 Transformers 英語
V
OpenGVLab
800
0
Multilingual E5 Large Instruct Q8 0 GGUF
MIT
多語言E5大型指令模型,支持多種語言的文本嵌入和分類任務,具有強大的跨語言能力。
大型語言模型 支持多種語言
M
Gomez12
90
1
R01 Gemma 3 1b It
Gemma 3是谷歌推出的輕量級開源多模態模型,基於與Gemini相同技術構建,支持文本和圖像輸入並生成文本輸出。
文本生成圖像 Transformers 英語
R
EpistemeAI
17
1
Latxa Llama 3.1 70B Instruct FP8
Latxa是基於Llama-3.1的70B參數巴斯克語大語言模型,經過指令微調和FP8量化,專為巴斯克語優化設計
大型語言模型 Transformers
L
HiTZ
988
1
MT Gen10 Gemma 2 9B
這是一個基於Gemma-2-9B系列模型通過DARE TIES方法合併的多模型融合版本,整合了多個Gemma變體的優勢。
大型語言模型 Transformers
M
zelk12
26
2
Qwen2.5 1.5B Instruct
Apache-2.0
專為Gensyn RL Swarm設計的1.5B參數指令微調模型,支持通過點對點強化學習進行本地微調
大型語言模型 Transformers 英語
Q
Gensyn
2.1M
4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase