Mellum 4b Sft Rust GGUF
Apache-2.0
專為Rust代碼中間填充(FIM)任務微調的大語言模型,基於JetBrains/Mellum-4b-base構建
大型語言模型 支持多種語言
M
Etherll
389
1
Qwen2.5 Coder 1.5B Instruct Reasoning
Gpl-3.0
基於Qwen2.5-Coder-1.5B-Instruct微調的代碼推理模型,增強了編程問題解決和邏輯推理能力
大型語言模型 支持多種語言
Q
bunyaminergen
130
1
Open Instruct Code Alpaca 7b
基於代碼羊駝數據集微調的7B參數LLaMa模型,專注於代碼生成任務
大型語言模型
Transformers 英語

O
allenai
29
2
Deepseek Coder V2 Base
其他
DeepSeek-Coder-V2 是一個專注於編程和代碼任務的AI助手,擅長編寫、調試和解釋多種編程語言的代碼。
大型語言模型
Transformers

D
deepseek-ai
4,588
71
Qwq Coder 32B
基於Qwen系列模型合併的32B參數大語言模型,專注於代碼生成與理解任務
大型語言模型
Transformers

Q
YOYO-AI
490
7
Granite 8b Code Instruct 128k GGUF
Apache-2.0
IBM Granite 8B代碼指令模型,支持128k上下文長度,專注於代碼生成和指令理解任務。
大型語言模型
Transformers 其他

G
tensorblock
186
1
Qwen2.5 Coder 1.5B GGUF
Apache-2.0
Qwen2.5-Coder-1.5B 是一個1.5B參數的代碼生成模型,支持多種編程語言,適用於代碼補全和生成任務。
大型語言模型
Transformers 支持多種語言

Q
tensorblock
162
1
Deepseek Coder V2 Lite Instruct FP8
其他
DeepSeek-Coder-V2-Lite-Instruct的FP8量化版本,適用於英語的商業和研究用途,優化了推理效率。
大型語言模型
Transformers

D
RedHatAI
11.29k
7
Granite 3b Code Instruct 128k
Apache-2.0
Granite-3B-Code-Instruct-128K 是一個擁有30億參數的長上下文指令模型,基於Granite-3B-Code-Base-128K微調而來,專注於編碼相關任務。
大型語言模型
Transformers

G
ibm-granite
1,516
10
Codestral 22B V0.1 Imat GGUF
其他
Codestral-22B-v0.1是Mistral AI開發的大型代碼生成模型,支持80多種編程語言,適用於代碼生成、解釋和重構任務。
大型語言模型 其他
C
qwp4w3hyb
362
3
Codestral 22B V0.1
其他
Codestral-22B-v0.1是Mistral AI發佈的22B參數編程語言模型,支持80多種編程語言的代碼生成與理解任務
大型語言模型
Transformers 其他

C
mistralai
14.04k
1,246
Granite 20b Code Instruct 8k
Apache-2.0
Granite-20B-Code-Instruct-8K是一個200億參數的代碼生成模型,基於Granite-20B-Code-Base-8K微調而來,專注於代碼生成和指令遵循能力。
大型語言模型
Transformers 其他

G
ibm-granite
824
40
Dolphin 2.9 Llama3 70b 5.0bpw H6 Exl2
Dolphin 2.9是基於Llama-3-70b的未經審查AI助手模型,具備多種指令、對話和編程技能,初步支持代理功能和函數調用。
大型語言模型
Transformers 英語

D
LoneStriker
22
3
Nxcode CQ 7B Orpo
其他
基於Qwen/CodeQwen1.5-7B模型,採用無參考模型的單體偏好優化方法在10萬條高質量排序數據上進行微調的代碼生成模型
大型語言模型
Transformers 其他

N
NTQAI
3,387
130
Codellama 34b Hf
Code Llama是Meta發佈的包含70億到340億參數的代碼生成與理解模型系列,本版本為340億參數基礎模型
大型語言模型
Transformers 其他

C
meta-llama
492
15
Starchat2 15b V0.1
StarChat2是基於StarCoder2微調的160億參數編程助手模型,擅長對話和代碼生成任務
大型語言模型
Transformers

S
HuggingFaceH4
4,196
111
Codellama 70B Python GPTQ
CodeLlama 70B Python 是一個專注於 Python 編程語言的大型語言模型,基於 Llama 2 架構,專為代碼生成和補全任務優化。
大型語言模型
Transformers 其他

C
TheBloke
89
19
Tinyllama 1.1B Chat V1.0 GGUF
Apache-2.0
TinyLlama是一個1.1B參數的輕量級Llama模型,專為聊天和編程輔助任務優化。
大型語言模型 英語
T
andrijdavid
117
2
Autodev Coder
其他
AutoDev Coder 是基於 deepseek-coder-6.7b-instruct 模型微調的大語言模型,專注於代碼生成與編程輔助任務。
大型語言模型
Transformers

A
unit-mesh
26
13
Codeninja 1.0 OpenChat 7B
MIT
代碼忍者是知名模型openchat/openchat-3.5-1210的增強版本,通過在兩個包含超過40萬條編碼指令的大規模數據集上進行監督微調訓練而成。
大型語言模型
Transformers

C
beowolx
2,998
105
Magicoder S DS 6.7B
其他
Magicoder是一個由OSS-Instruct賦能的新模型家族,通過開源代碼片段啟發LLM生成低偏差和高質量的代碼指令數據,專為編碼任務設計。
大型語言模型
Transformers

M
ise-uiuc
356
203
Magicoder DS 6.7B
其他
Magicoder是由OSS-Instruct技術驅動的代碼生成模型家族,通過開源代碼片段啟發LLM生成高質量代碼指令數據
大型語言模型
Transformers

M
ise-uiuc
151
38
Deepseek Coder 1.3b Instruct GPTQ
其他
Deepseek Coder 1.3B Instruct 的 GPTQ 量化版本,提供多種量化參數選擇,適用於代碼生成和計算機科學相關任務。
大型語言模型
Transformers

D
TheBloke
653
7
Deepseek Coder 6.7B Instruct AWQ
其他
Deepseek Coder 6.7B Instruct 是一個專注於編程任務的AI助手模型,由DeepSeek公司開發。它專門用於回答與計算機科學相關的問題,拒絕回答非技術性問題。
大型語言模型
Transformers

D
TheBloke
248
16
Wizardcoder Python 13B V1.0 GPTQ
WizardCoder Python 13B V1.0是由WizardLM開發的大語言模型,專注於Python代碼生成任務,基於llama2架構,在HumanEval基準測試中表現優異。
大型語言模型
Transformers

W
TheBloke
309
76
Codellama Chat 13b Chinese
Openrail
CodeLlaMa是專為代碼輔助設計的模型,擅長處理編程類問題解答,支持中英文多輪對話。
大型語言模型
Transformers 支持多種語言

C
shareAI
16
21
Codellama 7b Python Hf
Code Llama是Meta推出的70億參數Python專用代碼生成模型,基於Llama 2架構優化,專注於Python代碼合成與理解任務
大型語言模型
Transformers 其他

C
codellama
26.36k
141
Llama 2 Coder 7b
Apache-2.0
基於Llama-2 7b模型微調的代碼生成模型,專門用於編程輔助任務
大型語言模型
Transformers 其他

L
mrm8488
191
52
Starchat Beta
Openrail
StarChat-β是基於StarCoderPlus微調的語言模型,專注於編程輔助任務,支持80+編程語言
大型語言模型
Transformers

S
HuggingFaceH4
1,782
264
Starchat Alpha
Openrail
基於StarCoder微調的編程助手語言模型,160億參數規模,支持英語,適用於教育研究領域
大型語言模型
Transformers 支持多種語言

S
HuggingFaceH4
1,647
233
Starcoder Gpteacher Code Instruct
Openrail
基於StarCoder模型,使用GPTeacher代碼生成數據集進行微調,優化了代碼生成和解釋能力
大型語言模型
Transformers

S
GeorgiaTechResearchInstitute
122
81
Starcoder
Openrail
StarCoder是一個基於80多種編程語言訓練的15.5B參數代碼生成模型,支持8192個token的上下文窗口
大型語言模型
Transformers 其他

S
bigcode
10.72k
2,875
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98