輕量級微調

# 輕量級微調

Qvikhr 3 1.7B Instruction Noreasoning

QVikhr-3-1.7B-Instruction-noreasoning 是一個基於 Qwen/Qwen3-1.7B 的指令模型，在俄語數據集 GrandMaster2 上進行訓練，專為高效處理俄語和英語文本而設計。

大型語言模型

Thinkedit Deepseek Qwen 14b

ThinkEdit是一種輕量級權重編輯方法，通過識別並編輯少量注意力頭，緩解大語言模型在推理任務中生成過度簡短思維鏈的問題，提升推理準確性。

大型語言模型

Hermes 3 Llama 3.2 3B Abliterated

Hermes 3 3B 是 Nous Research 的 Hermes 系列 LLM 中一個雖小但強大的新成員，專注於將 LLM 與用戶對齊，賦予最終用戶強大的引導和控制能力。

大型語言模型

Transformers 英語

Qwen2.5 0.5b Test Ft

Qwen 2.5 0.5B 是一款緊湊而強大的語言模型，基於Qwen/Qwen2.5-0.5B-Instruct微調，支持多種語言，性能接近Llama 3.2 1B模型。

大型語言模型

Transformers 支持多種語言

Mt5 Small Finetuned Gazeta Ru

基於google/mt5-small在gazeta數據集上微調的俄語摘要生成模型

Paligemma 3b Ft Widgetcap 224

PaliGemma是一款多功能輕量級視覺語言模型，結合圖像和文本輸入生成文本輸出，支持多語言，在多種視覺語言任務中表現出色。

圖像生成文本

Paligemma 3b Ft Vqav2 224

PaliGemma是一款多功能輕量級視覺語言模型，結合圖像和文本輸入生成文本輸出，支持多語言。

文本生成圖像

Mistral Portuguese Luana 7b Chat

基於25萬個葡萄牙語聊天數據集訓練的Mistral 7B微調模型，專為葡萄牙語聊天場景優化

大型語言模型

Mamba是一個基於狀態空間模型(SSM)的高效語言模型，具有線性時間複雜度的序列建模能力。

大型語言模型

Mamba是基於狀態空間模型(SSM)架構的高效語言模型，具有1.4B參數規模，支持文本生成任務

大型語言模型

基於Mamba架構的28億參數語言模型，兼容HuggingFace Transformers庫

大型語言模型

Tinyllama Tarot V1

基於TinyLlama-1.1B微調的塔羅牌解讀模型，能夠根據塔羅牌進行預測和解讀。

大型語言模型

Med BLIP 2 QLoRA

BLIP2是基於OPT-2.7B的視覺語言模型，專注於視覺問答任務，能夠理解圖像內容並回答相關問題。

文本生成圖像

Tiny Vicuna 1B GGUF

Tiny-Vicuna-1B是基於TinyLLama 1.1B使用WizardVicuna數據集微調的輕量級模型，專為早期實驗迭代設計。

大型語言模型

Tiny Vicuna 1B是基於TinyLlama在WizardVicuna數據集上微調的版本，與Vicuna-v1.5系列兼容，適合早期實驗迭代。

大型語言模型

Transformers 英語

Orca 2 13B GGUF

Orca 2 13B 是微軟基於LLAMA-2微調的大語言模型，提供GGUF格式量化文件，支持多種硬件環境下的高效推理。

大型語言模型

Mistral 7b Guanaco

基於Llama2架構的預訓練語言模型，適用於英語文本生成任務

大型語言模型

Transformers 英語

基於Salesforce/blip-image-captioning-base微調的圖像描述生成模型

圖像生成文本

T5 Spanish Efficient Tiny

這是一個專為西班牙語優化的高效微型T5模型，體積小(<29MB)，適合CPU使用，需要微調後使用

大型語言模型

Transformers 西班牙語

Codet5 Small Generate Docstrings For Python Condensed

基於Salesforce/codet5-small微調的模型，用於為Python函數生成文檔字符串

Transformers 英語

Tiny Random T5ForConditionalGeneration Calibrated

一個經過優化校準的微型T5模型，適用於文本生成和轉換任務，具有輕量化和高效的特點。

大型語言模型

Sentence Similarity Semantic Search

該模型是基於新聞數據集微調的句子轉換器，專門用於語義搜索和句子相似度計算。

文本嵌入英語

基於distilroberta-base微調的模型，具體用途和訓練數據未明確說明

大型語言模型

Distilbert Base Turkish Cased Clip

基於dbmdz/distilbert-base-turkish-cased微調的土耳其語文本編碼器，用於與CLIP的ViT-B/32圖像編碼器配合使用

文本生成圖像

Electra Small Discriminator Finetuned Ner

基於ELECTRA-small架構的命名實體識別模型，在wikiann數據集上微調

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase