指令微調

# 指令微調

Tencent.hunyuan A13B Instruct GGUF

騰訊混元A13B指令模型的量化版本，通過技術手段在保證性能的同時提升運行效率。

大型語言模型

Gemma 3n E2B It Unsloth Bnb 4bit

Gemma 3n-E2B-it 是 Google 推出的輕量級開源多模態模型，基於與 Gemini 相同技術構建，專為低資源設備優化。

圖像生成文本

Transformers 英語

Gryphe Codex 24B Small 3.2 GGUF

這是Gryphe的Codex-24B-Small-3.2模型的量化版本，通過量化技術優化了在不同硬件條件下的運行效率。

大型語言模型英語

Gemma 3n E4B It

Gemma 3n是Google推出的輕量級、最先進的開源多模態模型家族，基於與Gemini模型相同的研究和技術構建，支持文本、音頻和視覺輸入。

圖像生成文本

Fanar 1 9B Instruct

Fanar-1-9B-Instruct 是一款強大的阿拉伯語 - 英語大語言模型，由卡塔爾計算研究機構（QCRI）開發，支持現代標準阿拉伯語及多種阿拉伯方言，並與伊斯蘭價值觀和阿拉伯文化保持一致。

大型語言模型

Transformers 支持多種語言

Kakaocorp.kanana 1.5 8b Instruct 2505 GGUF

Kanana-1.5-8B-Instruct-2505 是由 Kakao Corp 開發的一個 8B 參數規模的指令微調語言模型，適用於文本生成任務。

大型語言模型

Marin Community.marin 8b Instruct GGUF

marin-8b-instruct 是一個 8B 參數規模的指令微調語言模型，適用於文本生成任務。

大型語言模型

Seed Coder 8B Instruct GGUF

Seed-Coder-8B-Instruct 是一款強大的開源代碼模型，具有以模型為中心、透明和高性能等特點，在多種編碼任務中表現出色。

大型語言模型

Qwen2.5 1.5B S1k 1.1

該模型是基於Qwen/Qwen2.5-1.5B-Instruct微調而來的文本生成模型，使用TRL進行訓練，為文本生成任務提供了強大的支持。

大型語言模型

Spatial LLaVA 7B Gguf

Spatial-LLaVA-7B是基於LLaVA模型微調的多模態模型，專注於提升空間關係推理能力，適用於多模態研究和聊天機器人開發。

文本生成圖像

Gryphe Pantheon Proto RP 1.8 30B A3B GGUF

這是一個基於Gryphe/Pantheon-Proto-RP-1.8-30B-A3B模型的量化版本，使用llama.cpp進行量化，適用於角色扮演和文本生成任務。

大型語言模型英語

Bielik 4.5B V3.0 Instruct FP8 Dynamic

該模型是Bielik-4.5B-v3.0-Instruct的FP8量化版本，通過AutoFP8技術將權重和激活量化為FP8數據類型，減少約50%的磁盤空間和GPU內存需求。

大型語言模型其他

Bielik 1.5B V3.0 Instruct FP8 Dynamic

這是一個基於Bielik-1.5B-v3.0-Instruct模型的FP8動態量化版本，適配vLLM或SGLang推理框架，通過AutoFP8量化技術將參數字節數從16位降至8位，顯著降低磁盤空間和GPU顯存需求。

大型語言模型其他

Bielik 1.5B V3.0 Instruct GGUF

這是一個波蘭語的1.5B參數指令微調模型，基於SpeakLeash的Bielik系列開發，適用於文本生成任務。

大型語言模型其他

Allenai.olmo 2 0425 1B Instruct GGUF

OLMo-2-0425-1B-Instruct是由AllenAI開發的一個10億參數規模的指令微調語言模型，專注於文本生成任務。

大型語言模型

Olmo 2 0425 1B Instruct GGUF

OLMo 2 1B指令版是基於OLMo-2-0425-1B-RLVR1模型的後訓練變體，經過監督微調、DPO訓練和RLVR訓練，旨在實現多種任務的最先進性能。

大型語言模型英語

Smollm 135M Instruct

一個輕量級指令微調語言模型，專為移動端部署優化

大型語言模型

litert-community

Josiefied Qwen3 4B Abliterated V1 Gguf

這是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本，適用於本地部署和運行。

大型語言模型

Goekdeniz-Guelmez

Olmo 2 0425 1B Instruct

OLMo 2 1B是基於allenai/OLMo-2-0425-1B-RLVR1模型的後訓練變體，經過監督微調、DPO訓練和RLVR訓練，旨在實現多種任務的最先進性能。

大型語言模型

Transformers 英語

Industry Project V2

基於Mistral架構優化的指令微調模型，適用於零樣本分類任務

大型語言模型

Stablelm Zephyr 3b GGUF

StableLM Zephyr 3B是一個30億參數的指令調優模型，基於公開數據集、合成數據集和直接偏好優化(DPO)訓練，性能表現優異。

大型語言模型英語

Gemma 2 9b It Abliterated GGUF

基於Gemma 2.9B的量化版本，使用llama.cpp進行優化，適合在LM Studio中運行。

大型語言模型英語

Aya-23是一個開放權重的指令微調模型研究版本，具有高度先進的多語言能力，支持23種語言。

大型語言模型

Transformers 支持多種語言

Llama Krikri 8B Instruct

Llama-Krikri-8B-Instruct是由雅典娜研究中心開發的希臘語指令調優大語言模型，基於Llama-3.1-8B構建，增強了希臘語和英語的多任務處理能力。

大型語言模型

Transformers 支持多種語言

Badger Writer Llama 3 8b

Badger Writer 是基於多個 Llama 3 8B 模型的歸一化傅里葉任務疊加模型，專注於文本生成任務，特別擅長創意寫作和指令跟隨。

大型語言模型

MKLLM 7B Instruct

MKLLM-7B是一款面向馬其頓語的開源大語言模型，基於Mistral-7B-v0.1模型通過持續預訓練馬其頓語和英語混合文本構建而成。

大型語言模型

Transformers 支持多種語言

Gemma 2 Llama Swallow 27b It V0.1

基於Gemma-2架構的日語增強大語言模型，通過持續預訓練顯著提升日語能力，同時保留原版英語能力

大型語言模型

Transformers 支持多種語言

Gemma 2 Llama Swallow 9b It V0.1

Gemma-2-Llama-Swallow系列模型是在Gemma-2基礎上進行持續預訓練構建的多語言大模型，特別增強了日語能力。

大型語言模型

Transformers 支持多種語言

Gemma 2 Llama Swallow 2b It V0.1

Gemma-2-Llama-Swallow系列是通過對gemma-2模型進行持續預訓練構建的，顯著增強了日文語言處理能力，同時保留原有英文能力。

大型語言模型

Transformers 支持多種語言

Turkish Gemma 9b V0.1

Turkish-Gemma-9b-v0.1是基於Gemma-2-9b開發的土耳其語文本生成模型，通過持續預訓練、監督微調（SFT）、直接偏好優化（DPO）和模型合併技術優化而成。

大型語言模型

Bielik 4.5B V3.0 Instruct

Bielik-4.5B-v3-Instruct是一款擁有46億參數的波蘭語生成式文本模型，基於Bielik-4.5B-v3進行指令微調，展現出卓越的波蘭語理解和處理能力。

大型語言模型

Transformers 其他

OLMo 2 1B是艾倫人工智能研究所推出的開放語言模型系列中最小的模型，基於OLMo-mix-1124預訓練，並在中期訓練階段使用Dolmino-mix-1124數據集。

大型語言模型

Transformers 英語

Falcon E 1B Instruct

Falcon-E-1B-Instruct 是一個基於1.58比特架構的高效語言模型，專為邊緣設備優化，具有低內存佔用和高性能的特點。

大型語言模型

Qwen2.5 Recursive Coder 14B Instruct

基於Qwen2.5架構的14B參數規模代碼生成與理解模型，通過Model Stock方法融合多個專業編碼模型而成

大型語言模型

Videochat R1 Thinking 7B

VideoChat-R1-thinking_7B 是一個基於 Qwen2.5-VL-7B-Instruct 的多模態模型，專注於視頻文本轉文本任務。

視頻生成文本

Transformers 英語

Multilingual E5 Large Instruct Q8 0 GGUF

多語言E5大型指令模型，支持多種語言的文本嵌入和分類任務，具有強大的跨語言能力。

大型語言模型支持多種語言

R01 Gemma 3 1b It

Gemma 3是谷歌推出的輕量級開源多模態模型，基於與Gemini相同技術構建，支持文本和圖像輸入並生成文本輸出。

文本生成圖像

Transformers 英語

Latxa Llama 3.1 70B Instruct FP8

Latxa是基於Llama-3.1的70B參數巴斯克語大語言模型，經過指令微調和FP8量化，專為巴斯克語優化設計

大型語言模型

MT Gen10 Gemma 2 9B

這是一個基於Gemma-2-9B系列模型通過DARE TIES方法合併的多模型融合版本，整合了多個Gemma變體的優勢。

大型語言模型

Qwen2.5 1.5B Instruct

專為Gensyn RL Swarm設計的1.5B參數指令微調模型，支持通過點對點強化學習進行本地微調

大型語言模型

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase