指令微調模型

# 指令微調模型

Tngtech.olmo 2 Instruct Math 32B GGUF

OLMo-2-Instruct-Math-32B 是一個專注於數學任務的大型語言模型，由 tngtech 發佈。

大型語言模型

Mistral Small 3.1 24b Instruct 2503 Jackterated GGUF

這是一個基於Mistral架構的24B參數規模的大型語言模型，支持文本生成任務，採用GGUF格式。

大型語言模型

Mistral Small 3.1 24b Instruct 2503 Hf GGUF

這是一個基於mrfakename/mistral-small-3.1-24b-instruct-2503-hf模型的GGUF格式量化版本，適用於文本生成任務。

大型語言模型

Writing Model Qwen 7B

基於Qwen2.5-7B-Instruct微調的寫作評估專用模型，使用12K規模SFT數據集訓練

大型語言模型

Thedrummer Cydonia 24B V2.1 GGUF

Cydonia-24B-v2.1是一個24B參數的大語言模型，經過llama.cpp的imatrix量化處理，提供多種量化版本以適應不同硬件需求。

大型語言模型

Allenai.llama 3.1 Tulu 3.1 8B GGUF

Llama-3.1-Tulu-3.1-8B是由AllenAI開發的大語言模型，基於Llama架構，具有80億參數，專注於文本生成任務。

大型語言模型

Nvidia AceInstruct 7B GGUF

基於英偉達AceInstruct-7B模型的量化版本，使用llama.cpp進行量化，支持多種量化類型，適用於代碼、數學和通用領域任務。

大型語言模型

Smolvlm Instruct

基於HuggingFaceTB/SmolVLM-Instruct微調的智能視覺語言模型，採用Unsloth和TRL庫優化訓練速度

文本生成圖像

Transformers 英語

Llama 3.3 70B Instruct FP8 Dynamic

Llama-3.3-70B-Instruct-FP8-dynamic 是經過優化的大語言模型，通過將激活和權重量化為 FP8 數據類型，減少了 GPU 內存需求並提高了計算吞吐量，支持多語言的商業和研究用途。

大型語言模型

Transformers 支持多種語言

Chinese Text Correction 1.5b

Qwen2.5-1.5B-Instruct 是一個基於 Qwen2.5 架構的 15 億參數的中文指令微調模型，適用於文本生成和推理任務。

大型語言模型

Transformers 中文

Solar Pro Preview Instruct GGUF

該項目提供了 upstage/solar-pro-preview-instruct 模型的 GGUF 格式文件，適用於文本生成任務。

大型語言模型

Llama 3 8B Instruct

基於Llama-3-8B優化的北歐語言指令微調模型，支持瑞典語、丹麥語和挪威語

大型語言模型

Transformers 其他

AI-Sweden-Models

Llama 3 8B SFR Iterative DPO R

基於Llama-3-8B的指令優化模型，採用迭代式DPO強化學習訓練，在多項基準測試中超越同規模及部分大型模型

大型語言模型

Mistral 7B OpenOrca Oasst Top1 2023 08 25 V3 Mistral 7B Instruct V0.1

這是一個基於Mistral-7B架構的融合模型，結合了Mistral-7B-Instruct和OpenOrca-oasst_top1兩個模型的優勢，專注於多語言文本生成任務。

大型語言模型

Transformers 支持多種語言

Mamba 2.8b Instruct Openhermes

這是一個基於OpenHermes數據集微調的28億參數MAMBA模型，採用新型狀態空間架構，擅長文本生成任務。

大型語言模型

Transformers 英語

Gpt Sw3 20b Instruct 4bit Gptq

GPT-SW3是由AI瑞典開發的大型北歐語言模型，支持5種北歐語言和英語的文本生成任務。

大型語言模型

Transformers 支持多種語言

AI-Sweden-Models

Pivot 0.1 Evil A

PiVoT-0.1-early 是基於 Mistral 7B 微調的模型，專注於文本生成任務，具有不同的變體版本以滿足不同實驗需求。

大型語言模型

Transformers 支持多種語言

H2ogpt Gm Oasst1 En 2048 Open Llama 3b

基於OpenAssistant/oasst1數據集微調的3B參數大語言模型，使用H2O LLM Studio訓練

大型語言模型

Transformers 英語

orca_mini_3b是基於OpenLLaMa-3B模型訓練的文本生成模型，採用了來自WizardLM、Alpaca和Dolly-V2數據集的指令和輸入進行解釋性調優，並應用了Orca研究論文中的數據集構建方法。

大型語言模型

Transformers 英語

H2ogpt Gm Oasst1 En 2048 Open Llama 7b Preview 700bt

基於OpenLlama 7B預訓練模型微調的大語言模型，使用OpenAssistant數據集訓練，支持英文文本生成任務

大型語言模型

Transformers 英語

LaMini-T5-738M是基於t5-large在LaMini-instruction數據集上微調而成的指令微調模型，參數量為738M，屬於LaMini-LM系列模型之一。

大型語言模型

Transformers 英語

Lamini Flan T5 783M

LaMini-Flan-T5-783M是基於google/flan-t5-large在LaMini-instruction數據集上微調的指令跟隨模型，參數量為783M，屬於LaMini-LM系列之一。

大型語言模型

Transformers 英語

Lamini GPT 1.5B

LaMini-GPT-1.5B是基於GPT-2-xl架構微調的大型語言模型，屬於LaMini-LM系列，專注於指令跟隨任務

大型語言模型

Transformers 英語

Gpt4 X Alpaca 13b Native 4bit 128g

基於GPT4和Alpaca指令微調的13B參數語言模型，支持4bit量化推理

大型語言模型

該倉庫包含一個基於斯坦福Alpaca數據集內部調優的LLaMA-7b模型，主要用於機器翻譯研究。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase