Gemma 3n E4B It Litert Preview GGUF
Gemma-3n-E4B-it-litert-preview是基於Google的Gemma 3n模型微調的版本,支持圖像和文本輸入並生成文本輸出,適用於多模態任務。
圖像生成文本
Transformers 英語

G
unsloth
134
1
Gervasio 8b Portuguese Ptpt Decoder
MIT
Gervásio 8B PTPT是一款面向葡萄牙語的開源解碼器模型,基於LLaMA 3.1 8B Instruct微調,具備強大的文本生成能力。
大型語言模型
Transformers 其他

G
PORTULAN
105
1
Tiiuae.falcon H1 34B Instruct GGUF
Falcon-H1-34B-Instruct 是一個34B參數規模的大型語言模型,專注於指令遵循任務。
大型語言模型
T
DevQuasar
319
1
Hyperclovax SEED Text Instruct 0.5B GGUF
其他
基於llama.cpp生成的0.5B參數規模的文本生成模型,支持指令式文本生成任務
大型語言模型
H
Mungert
407
1
Thedrummer Rivermind Lux 12B V1 GGUF
這是一個12B參數的大語言模型,經過llama.cpp的imatrix量化處理,提供多種量化版本以適應不同硬件需求。
大型語言模型
T
bartowski
1,353
1
MN Nyx Chthonia 12B
這是一個基於多個12B參數規模模型的合併版本,採用model_stock方法融合了7個不同特性的預訓練語言模型,以增強綜合能力。
大型語言模型
Transformers

M
mergekit-community
31
2
Granite 3.3 8b Instruct Q8 0 GGUF
Apache-2.0
該模型是基於IBM Granite-3.3-8B指令微調模型轉換而來的GGUF格式模型,適用於文本生成任務。
大型語言模型
G
NikolayKozloff
36
2
Opencodereasoning Nemotron 7B
Apache-2.0
OpenCodeReasoning-Nemotron-7B 是基於 Qwen2.5-7B-Instruct 開發的大型語言模型,專注於代碼生成和推理任務,支持 32K tokens 的上下文長度。
大型語言模型
Transformers 支持多種語言

O
nvidia
5,410
30
Llama SEA LION V3.5 70B R
Llama-SEA-LION-v3.5-70B-R 是一個專為東南亞語言優化的混合功能大語言模型,支持13種語言,具備複雜推理和通用文本生成能力。
大型語言模型
Transformers 支持多種語言

L
aisingapore
2,406
1
Flan T5 Titlegen Springer
MIT
基於google/flan-t5-base微調的模型,專門用於將科學摘要精煉為簡潔標題的抽象摘要生成任務。
文本生成
Transformers 英語

F
tiam4tt
236
0
Qwen.qwen2.5 VL 3B Instruct GGUF
Qwen2.5-VL-3B-Instruct 是一個3B參數的視覺語言模型,支持圖文生成文本任務。
圖像生成文本
Q
DevQuasar
1,107
3
Llama 3.1 8B SuperNova EtherealHermes GGUF
Apache-2.0
基於Llama-3.1架構的8B參數大語言模型,提供多種量化版本的GGUF格式文件
大型語言模型 英語
L
tensorblock
44
1
Nano R1 Model
Apache-2.0
基於Unsloth和Huggingface TRL庫優化的Qwen2模型,推理速度提升2倍
大型語言模型
Transformers 英語

N
Mansi-30
25
2
T3Q Qwen2.5 14b V1.0 E3
Apache-2.0
基於Qwen/Qwen2.5-14B-Instruct-1M模型進行後訓練的版本,採用LoRA-8-4-0.0001-cosine-32-16配置,訓練數據為train_data_v1.0。
大型語言模型
Transformers 支持多種語言

T
JungZoona
1,557
25
Qwq 32B Gptqmodel 4bit Vortex V1
Apache-2.0
QwQ-32B是基於Qwen2架構的32B參數大語言模型,經過GPTQ方法4位整型量化處理,適用於高效文本生成任務。
大型語言模型
Safetensors 英語
Q
ModelCloud
1,620
11
Llama 3.1 8B UltraLong 1M Instruct
Nemotron-UltraLong-8B系列是專為處理超長文本序列設計的語言模型,支持最高400萬token的上下文窗口,同時保持卓越性能。
大型語言模型
Transformers 英語

L
nvidia
1,387
26
Buddyglassuncensored2025.4
這是一個基於 Mistral-Small-24B-Instruct-2501 的融合模型,採用了 DARE TIES 融合方法,整合了多個 24B 參數規模的模型。
大型語言模型
Transformers

B
darkc0de
52
4
Llama Krikri 8B Instruct GGUF
基於Llama-3.1-8B構建的希臘語指令調優大語言模型,增強希臘語能力並支持多語言任務
大型語言模型
Transformers

L
ilsp
257
11
Progenitor V3.3 LLaMa 70B
本項目通過融合多個70B規模的預訓練語言模型,旨在創造出性能更優的語言模型。以Llama 3.3指令模型為基礎,運用Linear DELLA融合方法進行模型融合。
大型語言模型
Transformers

P
Tarek07
101
10
Reasoningcore 3B R01
Apache-2.0
ReasoningCore‑3B 是由 EpitemeAI 開發的多語言、推理能力增強的大語言模型,在推理、對話管理、檢索和總結任務中表現出色。
大型語言模型
Transformers 英語

R
EpistemeAI
1,733
2
Captain Eris Violet V0.420 12B
其他
Captain Violet 是一個12B參數規模的合併模型,由Epiculous/Violet_Twilight-v0.2和Nitral-AI/Captain_BMO-12B通過mergekit工具合併而成,支持文本生成任務。
大型語言模型
Transformers 英語

C
Nitral-AI
445.12k
41
Llama SEA LION V3 8B IT
SEA-LION是一系列為東南亞地區預訓練和指令微調的大語言模型,致力於解決該地區多語言處理問題,為東南亞語言的自然語言處理提供強大支持。
大型語言模型
Transformers 支持多種語言

L
aisingapore
3,954
7
Ichigo Llama3.1 S Instruct V0.4
Apache-2.0
基於Llama-3架構的多模態語言模型,支持音頻和文本輸入理解,具有噪聲魯棒性和多輪對話能力
文本生成音頻 英語
I
homebrewltd
486
19
Hymba 1.5B Instruct
其他
基於Hymba-1.5B-Base進行指令微調的15億參數模型,具備數學推理、函數調用、角色扮演等複雜任務處理能力
大型語言模型
Transformers

H
nvidia
3,547
227
Videollama2.1 7B 16F Base
Apache-2.0
VideoLLaMA2.1是基於VideoLLaMA2的升級版本,專注於提升視頻大語言模型中的時空建模與音頻理解能力。
視頻生成文本
Transformers 英語

V
DAMO-NLP-SG
179
1
Videollama2.1 7B 16F
Apache-2.0
VideoLLaMA 2是一個多模態大語言模型,專注於視頻理解,具備時空建模和音頻理解能力。
文本生成視頻
Transformers 英語

V
DAMO-NLP-SG
2,813
10
Llama 3.1 8B Dragonfly V2
蜻蜓是基於Llama 3.1通過指令微調訓練的多模態視覺語言模型,支持圖像與文本的聯合理解與生成
圖像生成文本 英語
L
togethercomputer
113
1
Llama 3.2 Korean Bllossom 3B
Bllossom-3B是基於meta-llama/Meta-Llama-3.2-3B的韓英雙語增強版本,通過全參數微調和精選韓語數據訓練,完整保留英語能力的同時增強韓語處理能力。
大型語言模型
Transformers 支持多種語言

L
Bllossom
12.52k
173
Mini Ichigo Llama3.2 3B S Instruct
Apache-2.0
Ichigo-llama3s系列模型是由Homebrew Research開發的多模態語言模型,原生支持音頻和文本輸入理解。該模型基於Llama-3架構,通過WhisperVQ作為音頻文件標記器進行訓練,提升了音頻理解能力。
文本生成音頻
Safetensors 英語
M
Menlo
22
34
Ichigo Llama3.1 S Instruct V0.3 Phase 2
Apache-2.0
Ichigo-llama3s系列模型原生支持音頻和文本輸入理解,基於Llama-3架構,使用WhisperVQ作為音頻文件的tokenizer。
文本生成音頻 英語
I
homebrewltd
16
5
Llama 3.1 8B Instuct Uz GGUF
這是基於behbudiy/Llama-3.1-8B-Instuct-Uz的靜態量化版本,支持烏茲別克語和英語,適用於多種文本生成任務。
大型語言模型 支持多種語言
L
mradermacher
241
1
Solar Pro Preview Instruct
MIT
Solar Pro Preview是一款先進的大語言模型,擁有220億參數,專為單GPU運行而設計,性能卓越。
大型語言模型
Transformers 英語

S
upstage
10.60k
448
Eurollm 1.7B
Apache-2.0
EuroLLM-1.7B 是 EuroLLM 系列的首個預訓練模型,具備多語言處理能力,可理解和生成多種歐洲及其他相關語言的文本。
大型語言模型
Transformers 支持多種語言

E
utter-project
3,444
65
Magnum V2 12b
Apache-2.0
magnum-v2-12b是系列模型中的第四款,旨在復刻Claude 3系列模型(尤其是Sonnet和Opus)的文本質量。基於Mistral-Nemo-Base-2407微調而來,具備強大的文本生成能力。
大型語言模型
Safetensors 支持多種語言
M
anthracite-org
18.68k
89
Mistral Nemo Base 2407 Chatml
Apache-2.0
Mistral-Nemo-Base-2407是由Mistral AI與NVIDIA聯合訓練的120億參數生成式文本預訓練模型,性能超越同規模或更小規模的模型。
大型語言模型
Transformers 支持多種語言

M
IntervitensInc
191
3
Meta Llama 3.1 405B Instruct GGUF
Meta-Llama-3.1-405B-Instruct 是一個基於 Llama 3.1 架構的 4050 億參數大型語言模型,專為指令跟隨任務優化,支持多種語言。
大型語言模型 支持多種語言
M
MaziyarPanahi
189.43k
14
Meta Llama 3.1 8B Instruct GGUF
Llama-3.1-8B-Instruct 是由 Meta 發佈的一個 8B 參數規模的大語言模型,專注於指令跟隨任務。
大型語言模型
M
DevQuasar
485
3
Llama 3 8B Instruct RR
Llama-3-8B-Instruct-RR是一款基於Llama-3的模型,採用表徵重路由(RR)技術插入斷路器,旨在減少有害內容生成的同時保持模型能力。
大型語言模型
Transformers

L
GraySwanAI
3,676
13
Tarsier 34b
Apache-2.0
Tarsier-34b 是一個開源的大規模視頻語言模型,專注於生成高質量的視頻描述,並在多個公開基準測試中取得領先成績。
視頻生成文本
Transformers

T
omni-research
103
17
Llama 3 Instruct 8B SimPO SPPO Iter3 Merge
這是一個基於Meta Llama 3構建的合併預訓練語言模型,結合了SimPO和SPPO-Iter3兩個模型的優勢,適用於文本生成任務。
大型語言模型
Transformers

L
grimjim
8,305
4
- 1
- 2
- 3
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98