Devstral Small 2505 GGUF
Apache-2.0
專為軟件工程項目打造的高效語言模型,輕量級設計,支持128k大上下文窗口,適用於複雜編碼任務。
大型語言模型 支持多種語言
D
Mungert
1,409
1
Devstral Small 2505 Unsloth Bnb 4bit
Apache-2.0
Devstral是由Mistral AI和All Hands AI合作開發的軟件工程任務代理型大語言模型,擅長使用工具探索代碼庫、編輯多個文件以及驅動軟件工程代理。
大型語言模型
Safetensors 支持多種語言
D
unsloth
873
3
Kernelllm GGUF
其他
KernelLLM是基於Llama 3.1 Instruct微調的模型,專門用於編寫使用Triton的GPU內核。
大型語言模型
K
lmstudio-community
214
1
Devstral Small 2505 GGUF
Apache-2.0
Devstral是一款專為軟件工程任務設計的智能LLM,由Mistral AI和All Hands AI合作開發,擅長代碼探索、多文件編輯和驅動軟件工程代理。
大型語言模型 支持多種語言
D
unsloth
72.26k
64
Devstral Small 2505
Apache-2.0
Devstral是由Mistral AI與All Hands AI合作開發的面向軟件工程任務的智能大語言模型,擅長代碼庫探索、多文件編輯和驅動軟件工程代理。
大型語言模型
Safetensors 支持多種語言
D
mistralai
102.17k
601
Xgen Small 9B Instruct R
xGen-small是一款企業級緊湊型語言模型,通過領域聚焦的數據整理、可擴展的預訓練、長度擴展和強化學習微調,以可預測的低成本實現長上下文性能表現。
大型語言模型
Transformers 英語

X
Salesforce
97
4
Qwen2.5 VL 72B Instruct GGUF
其他
通義千問推出的多模態大模型,支持圖像文本生成和128k長上下文處理,具備多語言能力。
圖像生成文本 英語
Q
lmstudio-community
668
1
Zero Mistral 24B
MIT
Zero-Mistral-24B是基於Mistral-Small-3.1-24B-Instruct-2503改進的純文本模型,主要適配俄語和英語,移除了原版的視覺功能,專注於文本生成任務。
大型語言模型
Transformers 支持多種語言

Z
ZeroAgency
41
2
Pixtral 12b GGUF
Apache-2.0
Mistral-Community推出的多模態大模型,支持圖像和文本處理,具備128k上下文長度和可變圖像尺寸處理能力。
圖像生成文本
P
lmstudio-community
611
1
Xlam 2 1b Fc R
xLAM-2是Salesforce研發的大型動作模型系列,專注於多輪對話和函數調用能力,可作為AI代理的核心組件。
大型語言模型
Transformers 英語

X
Salesforce
63
2
Llama 3.1 405B Instruct
Llama 3.1是由Meta開發的多語言大語言模型系列,包含8B、70B和405B三種規模,支持多語言文本生成和代碼生成任務。
大型語言模型
Transformers 支持多種語言

L
meta-llama
34.83k
569
Saanvi C0 12B
Apache-2.0
120億參數大語言模型,專為速度、效率和上下文準確性優化,支持RAG增強技術和128k上下文窗口。
大型語言模型
Transformers

S
riple-saanvi-lab
170
2
Qwen2.5 The Wisemen QwQ Deep Tiny Sherlock 32B
Apache-2.0
基於QwQ-32B推理與思維模型,融合了多個頂級推理模型的特色,專注於減少提示中的'過度思考',適用於創意用例和深入推理。
大型語言模型
Transformers 其他

Q
DavidAU
763
4
Llama3.1 MOE 4X8B Gated IQ Multi Tier COGITO Deep Reasoning 32B GGUF
Apache-2.0
一個具備可調節推理能力的混合專家(MoE)模型,通過4個8B模型的協作實現增強推理和文本生成能力
大型語言模型 支持多種語言
L
DavidAU
829
2
Llama SEA LION V3.5 70B R
Llama-SEA-LION-v3.5-70B-R 是一個專為東南亞語言優化的混合功能大語言模型,支持13種語言,具備複雜推理和通用文本生成能力。
大型語言模型
Transformers 支持多種語言

L
aisingapore
2,406
1
Llama SEA LION V3.5 8B R
Llama-SEA-LION-v3.5-8B-R是一個針對東南亞語言優化的8B參數大型語言模型,支持13種東南亞語言,具備複雜推理和通用文本生成能力。
大型語言模型
Transformers 支持多種語言

L
aisingapore
1,975
2
Cogito V1 Preview Qwen 32B Exl2 4.65bpw
Apache-2.0
Cogito v1 預覽版是基於Qwen2.5-32B的指令調優生成式模型,支持30多種語言,上下文長度達128k,針對編程、STEM、指令遵循和通用幫助性進行了優化。
大型語言模型
Transformers

C
async0x42
27
3
Xlam 2 3b Fc R
xLAM-2系列是基於先進數據合成和訓練流程構建的大型動作模型(LAMs),專注於多輪對話和工具使用,在函數調用和代理任務中表現卓越。
大型語言模型
Transformers 英語

X
Salesforce
353
5
Xlam 2 32b Fc R
xLAM-2是Salesforce推出的新一代大型動作模型,專注於多輪對話和函數調用能力,能夠將用戶意圖轉化為可執行動作,作為AI代理的核心組件。
大型語言模型
Transformers 英語

X
Salesforce
319
4
Llama Xlam 2 8b Fc R
xLAM-2系列是基於APIGen-MT框架訓練的大型動作模型,專注於多輪對話和函數調用能力,適用於AI代理開發。
大型語言模型
Transformers 英語

L
Salesforce
778
8
Llama Xlam 2 70b Fc R
xLAM-2是SalesforceAIResearch開發的大型動作模型(LAM)系列,專注於將用戶意圖轉化為可執行動作,增強AI代理的決策能力。
大型語言模型
Transformers 英語

L
Salesforce
420
10
Gemma 3 Nine Rings Of Power Fiction Horror 4b It GGUF
Apache-2.0
基於Google Gemma-3模型,通過9種Neo和恐怖Imatrix方法微調,專注於恐怖和虛構內容生成
大型語言模型 英語
G
DavidAU
6,418
1
Qwen2.5 MOE 2X1.5B DeepSeek Uncensored Censored 4B Gguf
Apache-2.0
這是一個Qwen2.5 MOE(專家混合)模型,由兩個Qwen 2.5 DeepSeek(審查版/普通版和無審查版)1.5B模型組成,形成一個4B模型,其中無審查版本的DeepSeek Qwen 2.5 1.5B主導模型行為。
大型語言模型 支持多種語言
Q
DavidAU
678
5
Llama 3.2 11b Vision R1 Distill
Llama 3.2-Vision是由Meta開發的多模態大語言模型,支持圖像和文本輸入,針對視覺識別、圖像推理和描述任務進行了優化。
圖像生成文本
Transformers 支持多種語言

L
bababababooey
29
1
Meta Llama 3.1 8B Instruct FP16
Llama 3.1是Meta開發的多語言大語言模型集合,包含8B、70B和405B參數版本,支持8種語言,針對對話用例優化。
大型語言模型
Safetensors 支持多種語言
M
context-labs
565.13k
1
Llama SEA LION V3 8B IT
SEA-LION是一系列為東南亞地區預訓練和指令微調的大語言模型,致力於解決該地區多語言處理問題,為東南亞語言的自然語言處理提供強大支持。
大型語言模型
Transformers 支持多種語言

L
aisingapore
3,954
7
L3.2 Rogue Creative Instruct Uncensored 7B GGUF
Apache-2.0
基於Llama 3.2架構的7B參數無審查創意寫作模型,支持128k上下文長度,專為小說創作、情節生成和角色扮演優化
大型語言模型 英語
L
DavidAU
577
7
Llama 3.2 3B Instruct AWQ
Llama 3.2是Meta推出的多語言大語言模型集合,包含1B和3B參數規模的預訓練和指令調優版本,針對多語言對話用例優化,支持8種官方語言。
大型語言模型
Transformers 支持多種語言

L
AMead10
4,500
2
Llama 3.2 3B Instruct
Llama 3.2 是 Meta 推出的多語言大語言模型集合,包含 1B 和 3B 大小的預訓練和指令調優生成模型。它針對多語言對話用例進行了優化,在常見行業基準測試中表現出色。
大型語言模型
Transformers 支持多種語言

L
alpindale
1,691
8
Llama 3.2 1B Instruct
Llama 3.2是一組預訓練和指令調優的生成模型,包含1B和3B規模,針對多語言對話用例進行了優化,包括代理檢索和摘要任務。
大型語言模型
Transformers 支持多種語言

L
alpindale
31.82k
2
Vikhr Nemo 12B Instruct R 21 09 24
Apache-2.0
Vikhr-Nemo是基於Mistral-Nemo-Instruct-2407優化的雙語大語言模型,專為俄語和英語優化,支持邏輯推理、文本摘要、代碼生成等多種任務。
大型語言模型
Transformers 支持多種語言

V
Vikhrmodels
3,707
118
Llama 3.2 90B Vision Instruct
Llama 3.2-Vision是Meta開發的多模態大語言模型,支持圖像和文本輸入,文本輸出,在視覺識別、圖像推理、圖像描述和圖像問答任務上表現優異。
圖像生成文本
Transformers 支持多種語言

L
meta-llama
15.44k
337
Llama 3.2 11B Vision
Llama 3.2-Vision是由Meta開發的多模態大語言模型系列,包含11B和90B兩種規模,支持圖像+文本輸入和文本輸出,針對視覺識別、圖像推理、圖像描述和圖像問答任務進行了優化。
圖像生成文本
Transformers 支持多種語言

L
meta-llama
31.12k
511
Llama 3.2 3B
Llama 3.2是Meta開發的多語言大語言模型系列,包含1B和3B規模的預訓練及指令調優生成模型,針對多語言對話場景優化,支持文本輸入/輸出。
大型語言模型
Transformers 支持多種語言

L
meta-llama
602.29k
555
Llama 3.2 3B Instruct
Llama 3.2是由Meta開發的多語言大語言模型系列,包含1B和3B規模的預訓練及指令調優生成模型,針對多語言對話場景優化。
大型語言模型
Transformers 支持多種語言

L
meta-llama
1.6M
1,391
Llama 3.2 1B Instruct
Llama 3.2是Meta開發的多語言大語言模型系列,包含1B和3B規模的預訓練及指令調優生成模型,針對多語言對話場景優化,支持智能檢索和摘要任務。
大型語言模型
Transformers 支持多種語言

L
meta-llama
2.4M
901
Llama 3.2 1B
Llama 3.2是Meta推出的多語言大語言模型系列,包含1B和3B參數的預訓練及指令調優生成模型,針對多語言對話場景優化,支持代理檢索和摘要任務。
大型語言模型
Transformers 支持多種語言

L
meta-llama
2.1M
1,866
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一個多語言大語言模型,針對多語言對話用例進行了優化,在常見的行業基準測試中表現優異。
大型語言模型 英語
L
modularai
9.7M
4
Llama 3.1 8B
Meta Llama 3.1 是一個多語言大語言模型系列,包含8B、70B和405B三種規模的預訓練及指令調優生成模型,針對多語言對話場景優化。
大型語言模型
Transformers 支持多種語言

L
meta-llama
1.0M
1,583
Yarn Mistral 7B 128k AWQ
Apache-2.0
Yarn Mistral 7B 128K是一款針對長上下文優化的先進語言模型,通過YaRN擴展方法在長上下文數據上進一步預訓練,支持128k令牌的上下文窗口。
大型語言模型
Transformers 英語

Y
TheBloke
483
72
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98