指令微調優化

# 指令微調優化

Gemma 3n E4B It Litert Preview GGUF

Gemma-3n-E4B-it-litert-preview是基於Google的Gemma 3n模型微調的版本，支持圖像和文本輸入並生成文本輸出，適用於多模態任務。

圖像生成文本

Transformers 英語

Gervasio 8b Portuguese Ptpt Decoder

Gervásio 8B PTPT是一款面向葡萄牙語的開源解碼器模型，基於LLaMA 3.1 8B Instruct微調，具備強大的文本生成能力。

大型語言模型

Transformers 其他

Tiiuae.falcon H1 34B Instruct GGUF

Falcon-H1-34B-Instruct 是一個34B參數規模的大型語言模型，專注於指令遵循任務。

大型語言模型

Hyperclovax SEED Text Instruct 0.5B GGUF

基於llama.cpp生成的0.5B參數規模的文本生成模型，支持指令式文本生成任務

大型語言模型

Thedrummer Rivermind Lux 12B V1 GGUF

這是一個12B參數的大語言模型，經過llama.cpp的imatrix量化處理，提供多種量化版本以適應不同硬件需求。

大型語言模型

MN Nyx Chthonia 12B

這是一個基於多個12B參數規模模型的合併版本，採用model_stock方法融合了7個不同特性的預訓練語言模型，以增強綜合能力。

大型語言模型

mergekit-community

Granite 3.3 8b Instruct Q8 0 GGUF

該模型是基於IBM Granite-3.3-8B指令微調模型轉換而來的GGUF格式模型，適用於文本生成任務。

大型語言模型

Opencodereasoning Nemotron 7B

OpenCodeReasoning-Nemotron-7B 是基於 Qwen2.5-7B-Instruct 開發的大型語言模型，專注於代碼生成和推理任務，支持 32K tokens 的上下文長度。

大型語言模型

Transformers 支持多種語言

Llama SEA LION V3.5 70B R

Llama-SEA-LION-v3.5-70B-R 是一個專為東南亞語言優化的混合功能大語言模型，支持13種語言，具備複雜推理和通用文本生成能力。

大型語言模型

Transformers 支持多種語言

Flan T5 Titlegen Springer

基於google/flan-t5-base微調的模型，專門用於將科學摘要精煉為簡潔標題的抽象摘要生成任務。

Transformers 英語

Qwen.qwen2.5 VL 3B Instruct GGUF

Qwen2.5-VL-3B-Instruct 是一個3B參數的視覺語言模型，支持圖文生成文本任務。

圖像生成文本

Llama 3.1 8B SuperNova EtherealHermes GGUF

基於Llama-3.1架構的8B參數大語言模型，提供多種量化版本的GGUF格式文件

大型語言模型英語

基於Unsloth和Huggingface TRL庫優化的Qwen2模型，推理速度提升2倍

大型語言模型

Transformers 英語

T3Q Qwen2.5 14b V1.0 E3

基於Qwen/Qwen2.5-14B-Instruct-1M模型進行後訓練的版本，採用LoRA-8-4-0.0001-cosine-32-16配置，訓練數據為train_data_v1.0。

大型語言模型

Transformers 支持多種語言

Qwq 32B Gptqmodel 4bit Vortex V1

QwQ-32B是基於Qwen2架構的32B參數大語言模型，經過GPTQ方法4位整型量化處理，適用於高效文本生成任務。

大型語言模型

Safetensors 英語

Llama 3.1 8B UltraLong 1M Instruct

Nemotron-UltraLong-8B系列是專為處理超長文本序列設計的語言模型，支持最高400萬token的上下文窗口，同時保持卓越性能。

大型語言模型

Transformers 英語

Buddyglassuncensored2025.4

這是一個基於 Mistral-Small-24B-Instruct-2501 的融合模型，採用了 DARE TIES 融合方法，整合了多個 24B 參數規模的模型。

大型語言模型

Llama Krikri 8B Instruct GGUF

基於Llama-3.1-8B構建的希臘語指令調優大語言模型，增強希臘語能力並支持多語言任務

大型語言模型

Progenitor V3.3 LLaMa 70B

本項目通過融合多個70B規模的預訓練語言模型，旨在創造出性能更優的語言模型。以Llama 3.3指令模型為基礎，運用Linear DELLA融合方法進行模型融合。

大型語言模型

Reasoningcore 3B R01

ReasoningCore‑3B 是由 EpitemeAI 開發的多語言、推理能力增強的大語言模型，在推理、對話管理、檢索和總結任務中表現出色。

大型語言模型

Transformers 英語

Captain Eris Violet V0.420 12B

Captain Violet 是一個12B參數規模的合併模型，由Epiculous/Violet_Twilight-v0.2和Nitral-AI/Captain_BMO-12B通過mergekit工具合併而成，支持文本生成任務。

大型語言模型

Transformers 英語

Llama SEA LION V3 8B IT

SEA-LION是一系列為東南亞地區預訓練和指令微調的大語言模型，致力於解決該地區多語言處理問題，為東南亞語言的自然語言處理提供強大支持。

大型語言模型

Transformers 支持多種語言

Ichigo Llama3.1 S Instruct V0.4

基於Llama-3架構的多模態語言模型，支持音頻和文本輸入理解，具有噪聲魯棒性和多輪對話能力

文本生成音頻英語

Hymba 1.5B Instruct

基於Hymba-1.5B-Base進行指令微調的15億參數模型，具備數學推理、函數調用、角色扮演等複雜任務處理能力

大型語言模型

Videollama2.1 7B 16F Base

VideoLLaMA2.1是基於VideoLLaMA2的升級版本，專注於提升視頻大語言模型中的時空建模與音頻理解能力。

視頻生成文本

Transformers 英語

Videollama2.1 7B 16F

VideoLLaMA 2是一個多模態大語言模型，專注於視頻理解，具備時空建模和音頻理解能力。

文本生成視頻

Transformers 英語

Llama 3.1 8B Dragonfly V2

蜻蜓是基於Llama 3.1通過指令微調訓練的多模態視覺語言模型，支持圖像與文本的聯合理解與生成

圖像生成文本英語

togethercomputer

Llama 3.2 Korean Bllossom 3B

Bllossom-3B是基於meta-llama/Meta-Llama-3.2-3B的韓英雙語增強版本，通過全參數微調和精選韓語數據訓練，完整保留英語能力的同時增強韓語處理能力。

大型語言模型

Transformers 支持多種語言

Mini Ichigo Llama3.2 3B S Instruct

Ichigo-llama3s系列模型是由Homebrew Research開發的多模態語言模型，原生支持音頻和文本輸入理解。該模型基於Llama-3架構，通過WhisperVQ作為音頻文件標記器進行訓練，提升了音頻理解能力。

文本生成音頻

Safetensors 英語

Ichigo Llama3.1 S Instruct V0.3 Phase 2

Ichigo-llama3s系列模型原生支持音頻和文本輸入理解，基於Llama-3架構，使用WhisperVQ作為音頻文件的tokenizer。

文本生成音頻英語

Llama 3.1 8B Instuct Uz GGUF

這是基於behbudiy/Llama-3.1-8B-Instuct-Uz的靜態量化版本，支持烏茲別克語和英語，適用於多種文本生成任務。

大型語言模型支持多種語言

Solar Pro Preview Instruct

Solar Pro Preview是一款先進的大語言模型，擁有220億參數，專為單GPU運行而設計，性能卓越。

大型語言模型

Transformers 英語

EuroLLM-1.7B 是 EuroLLM 系列的首個預訓練模型，具備多語言處理能力，可理解和生成多種歐洲及其他相關語言的文本。

大型語言模型

Transformers 支持多種語言

magnum-v2-12b是系列模型中的第四款，旨在復刻Claude 3系列模型（尤其是Sonnet和Opus）的文本質量。基於Mistral-Nemo-Base-2407微調而來，具備強大的文本生成能力。

大型語言模型

Safetensors 支持多種語言

Mistral Nemo Base 2407 Chatml

Mistral-Nemo-Base-2407是由Mistral AI與NVIDIA聯合訓練的120億參數生成式文本預訓練模型，性能超越同規模或更小規模的模型。

大型語言模型

Transformers 支持多種語言

Meta Llama 3.1 405B Instruct GGUF

Meta-Llama-3.1-405B-Instruct 是一個基於 Llama 3.1 架構的 4050 億參數大型語言模型，專為指令跟隨任務優化，支持多種語言。

大型語言模型支持多種語言

Meta Llama 3.1 8B Instruct GGUF

Llama-3.1-8B-Instruct 是由 Meta 發佈的一個 8B 參數規模的大語言模型，專注於指令跟隨任務。

大型語言模型

Llama 3 8B Instruct RR

Llama-3-8B-Instruct-RR是一款基於Llama-3的模型，採用表徵重路由（RR）技術插入斷路器，旨在減少有害內容生成的同時保持模型能力。

大型語言模型

Tarsier-34b 是一個開源的大規模視頻語言模型，專注於生成高質量的視頻描述，並在多個公開基準測試中取得領先成績。

視頻生成文本

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

這是一個基於Meta Llama 3構建的合併預訓練語言模型，結合了SimPO和SPPO-Iter3兩個模型的優勢，適用於文本生成任務。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase