Knowledgecore 12B
KnowledgeCore.12B 是一個通過 mergekit 工具合併的 12B 參數規模的大型語言模型,基於 PocketDoc/Dans-PersonalityEngine-V1.1.0-12b 和 inflatebot/MN-12B-Mag-Mell-R1 模型融合而成。
大型語言模型
Transformers

K
yamatazen
15
2
Mistral 7B OpenOrca GGUF
Apache-2.0
Mistral 7B OpenOrca是基於Mistral-7B架構的大語言模型,由OpenOrca團隊訓練,專注於文本生成任務。
大型語言模型 英語
M
TheBloke
7,792
245
Aurora SCE 12B
基於SCE方法合併的多語言ChatML模型,支持英文和日文對話
大型語言模型
Transformers 支持多種語言

A
yamatazen
51
6
Patricide 12B Unslop Mell
Apache-2.0
基於SLERP融合法的12B參數語言模型,合併了Mag-Mell和UnslopNemo模型的優勢,適用於創意寫作和角色扮演場景
大型語言模型
Transformers

P
redrix
1,311
16
Starcannon Unleashed 12B V1.0
Starcannon-Unleashed-12B-v1.0是一個合併模型,結合了Starcannon v3和NemoMix Unleashed 12B的優點,旨在提升長文本生成和角色扮演能力。
大型語言模型
Transformers

S
VongolaChouko
52
47
Tess V2.5 Phi 3 Medium 128k 14B
MIT
基於Microsoft Phi-3-medium-128k-instruct微調的大語言模型,支持ChatML格式對話交互
大型語言模型
Transformers

T
migtissera
4,932
4
Jambatypus V0.1
Apache-2.0
基於Jamba-v0.1在Open-Platypus-Chat數據集上通過QLoRA微調的大語言模型,支持對話任務
大型語言模型
Transformers 英語

J
mlabonne
21
39
Sauerkrautlm 7b HerO Mistral 7B Instruct V0.1 GGUF
Apache-2.0
這是一個基於Mistral-7B-Instruct-v0.1微調的德語/英語雙語模型,採用GGUF格式量化,支持2-8比特多種量化級別。
大型語言模型 支持多種語言
S
MaziyarPanahi
90
2
Westlake 7B V2 Laser Truthy Dpo
Apache-2.0
基於WestLake-7B-v2-laser模型在truthy-dpo-v0.1數據集上進行微調的大語言模型,專注於文本生成任務,在多項基準測試中表現優異。
大型語言模型
Transformers

W
macadeliccc
9,693
25
Discolm German 7b V1
Apache-2.0
DiscoLM 德語 7b 是一款基於Mistral的大型語言模型,專注於德語應用,是EM German模型家族的繼任者。該模型在大量德語和英語指令數據集上進行了SFT微調,並通過DPO強化學習進一步優化。
大型語言模型
Transformers 支持多種語言

D
DiscoResearch
262
67
Openhermes 2.5 Neural Chat 7b V3 2 7B
Apache-2.0
該模型是通過ties合併方法融合OpenHermes-2.5-Mistral-7B與Intel的neural-chat-7b-v3-2兩個模型而成,專注於文本生成任務。
大型語言模型
Transformers

O
Weyaxi
462
26
Causallm 14B DPO Alpha GGUF
基於14B參數的因果語言模型,經過DPO優化訓練,支持中英文文本生成任務
大型語言模型 支持多種語言
C
tastypear
2,238
85
Koopenchat Sft
koOpenChat-sft是基於OpenChat3.5優化的韓語對話模型,支持ChatML和Alpaca格式的指令交互。
大型語言模型
Transformers

K
maywell
1,836
7
Codellama 13b Oasst Sft V10
基於Meta的CodeLlama 13B大語言模型進行Open-Assistant微調的版本,支持英語,採用新的RoPE Theta值(1e6替代1e4)。
大型語言模型
Transformers 英語

C
OpenAssistant
159
69
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98