Knowledgecore 12B
KnowledgeCore.12B は mergekit ツールを使用して統合された12Bパラメータ規模の大規模言語モデルで、PocketDoc/Dans-PersonalityEngine-V1.1.0-12b と inflatebot/MN-12B-Mag-Mell-R1 モデルを融合して作成されました。
大規模言語モデル
Transformers

K
yamatazen
15
2
Mistral 7B OpenOrca GGUF
Apache-2.0
Mistral 7B OpenOrcaはMistral-7Bアーキテクチャに基づく大規模言語モデルで、OpenOrcaチームによって訓練され、テキスト生成タスクに特化しています。
大規模言語モデル 英語
M
TheBloke
7,792
245
Aurora SCE 12B
SCE手法で統合された多言語ChatMLモデル、英語と日本語の対話をサポート
大規模言語モデル
Transformers 複数言語対応

A
yamatazen
51
6
Patricide 12B Unslop Mell
Apache-2.0
SLERP融合法に基づく12Bパラメータ言語モデルで、Mag-MellとUnslopNemoモデルの利点を統合し、クリエイティブライティングやロールプレイシナリオに適しています
大規模言語モデル
Transformers

P
redrix
1,311
16
Starcannon Unleashed 12B V1.0
Starcannon-Unleashed-12B-v1.0は、Starcannon v3とNemoMix Unleashed 12Bの利点を組み合わせたマージモデルで、長文生成とロールプレイ能力の向上を目的としています。
大規模言語モデル
Transformers

S
VongolaChouko
52
47
Tess V2.5 Phi 3 Medium 128k 14B
MIT
Microsoft Phi-3-medium-128k-instructをファインチューニングした大規模言語モデルで、ChatML形式の対話をサポート
大規模言語モデル
Transformers

T
migtissera
4,932
4
Jambatypus V0.1
Apache-2.0
Jamba-v0.1をOpen-Platypus-ChatデータセットでQLoRAファインチューニングした大規模言語モデル、対話タスクに対応
大規模言語モデル
Transformers 英語

J
mlabonne
21
39
Sauerkrautlm 7b HerO Mistral 7B Instruct V0.1 GGUF
Apache-2.0
これはMistral-7B-Instruct-v0.1を微調整したドイツ語/英語のバイリンガルモデルで、GGUF形式で量子化されており、2-8ビットの複数の量子化レベルをサポートしています。
大規模言語モデル 複数言語対応
S
MaziyarPanahi
90
2
Westlake 7B V2 Laser Truthy Dpo
Apache-2.0
WestLake-7B-v2-laserモデルをベースに、truthy-dpo-v0.1データセットで微調整された大規模言語モデルで、テキスト生成タスクに特化し、複数のベンチマークテストで優れた成績を収めています。
大規模言語モデル
Transformers

W
macadeliccc
9,693
25
Discolm German 7b V1
Apache-2.0
DiscoLM ドイツ語 7b はMistralベースの大規模言語モデルで、ドイツ語アプリケーションに特化しており、EM Germanモデルファミリーの後継モデルです。このモデルは大量のドイツ語と英語の指示データセットでSFT微調整され、DPO強化学習によってさらに最適化されています。
大規模言語モデル
Transformers 複数言語対応

D
DiscoResearch
262
67
Openhermes 2.5 Neural Chat 7b V3 2 7B
Apache-2.0
このモデルはties融合法によりOpenHermes-2.5-Mistral-7BとIntelのneural-chat-7b-v3-2を融合したもので、テキスト生成タスクに特化しています。
大規模言語モデル
Transformers

O
Weyaxi
462
26
Causallm 14B DPO Alpha GGUF
14Bパラメータの因果言語モデルをベースに、DPO最適化トレーニングを経て、中英文テキスト生成タスクをサポート
大規模言語モデル 複数言語対応
C
tastypear
2,238
85
Koopenchat Sft
koOpenChat-sftはOpenChat3.5を最適化した韓国語会話モデルで、ChatMLとAlpaca形式の命令インタラクションをサポートしています。
大規模言語モデル
Transformers

K
maywell
1,836
7
Codellama 13b Oasst Sft V10
MetaのCodeLlama 13B大規模言語モデルを基にOpen-Assistantでファインチューニングしたバージョンで、英語をサポートし、新しいRoPE Theta値(1e4の代わりに1e6)を採用しています。
大規模言語モデル
Transformers 英語

C
OpenAssistant
159
69
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98