ChatML兼容

# ChatML兼容

Knowledgecore 12B

KnowledgeCore.12B 是一個通過 mergekit 工具合併的 12B 參數規模的大型語言模型，基於 PocketDoc/Dans-PersonalityEngine-V1.1.0-12b 和 inflatebot/MN-12B-Mag-Mell-R1 模型融合而成。

大型語言模型

Mistral 7B OpenOrca GGUF

Mistral 7B OpenOrca是基於Mistral-7B架構的大語言模型，由OpenOrca團隊訓練，專注於文本生成任務。

大型語言模型英語

基於SCE方法合併的多語言ChatML模型，支持英文和日文對話

大型語言模型

Transformers 支持多種語言

Patricide 12B Unslop Mell

基於SLERP融合法的12B參數語言模型，合併了Mag-Mell和UnslopNemo模型的優勢，適用於創意寫作和角色扮演場景

大型語言模型

Starcannon Unleashed 12B V1.0

Starcannon-Unleashed-12B-v1.0是一個合併模型，結合了Starcannon v3和NemoMix Unleashed 12B的優點，旨在提升長文本生成和角色扮演能力。

大型語言模型

Tess V2.5 Phi 3 Medium 128k 14B

基於Microsoft Phi-3-medium-128k-instruct微調的大語言模型，支持ChatML格式對話交互

大型語言模型

Jambatypus V0.1

基於Jamba-v0.1在Open-Platypus-Chat數據集上通過QLoRA微調的大語言模型，支持對話任務

大型語言模型

Transformers 英語

Sauerkrautlm 7b HerO Mistral 7B Instruct V0.1 GGUF

這是一個基於Mistral-7B-Instruct-v0.1微調的德語/英語雙語模型，採用GGUF格式量化，支持2-8比特多種量化級別。

大型語言模型支持多種語言

Westlake 7B V2 Laser Truthy Dpo

基於WestLake-7B-v2-laser模型在truthy-dpo-v0.1數據集上進行微調的大語言模型，專注於文本生成任務，在多項基準測試中表現優異。

大型語言模型

Discolm German 7b V1

DiscoLM 德語 7b 是一款基於Mistral的大型語言模型，專注於德語應用，是EM German模型家族的繼任者。該模型在大量德語和英語指令數據集上進行了SFT微調，並通過DPO強化學習進一步優化。

大型語言模型

Transformers 支持多種語言

Openhermes 2.5 Neural Chat 7b V3 2 7B

該模型是通過ties合併方法融合OpenHermes-2.5-Mistral-7B與Intel的neural-chat-7b-v3-2兩個模型而成，專注於文本生成任務。

大型語言模型

Causallm 14B DPO Alpha GGUF

基於14B參數的因果語言模型，經過DPO優化訓練，支持中英文文本生成任務

大型語言模型支持多種語言

koOpenChat-sft是基於OpenChat3.5優化的韓語對話模型，支持ChatML和Alpaca格式的指令交互。

大型語言模型

Codellama 13b Oasst Sft V10

基於Meta的CodeLlama 13B大語言模型進行Open-Assistant微調的版本，支持英語，採用新的RoPE Theta值（1e6替代1e4）。

大型語言模型

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase