GLM 4 32B 0414 EXL3
Apache-2.0
GLM-4-32B-0414是THUDM團隊開發的大規模語言模型,基於GLM架構,適用於多種文本生成任務。
大型語言模型
G
owentruong
36
2
Kanana Nano 2.1b Instruct
Kanana是由Kakao開發的雙語(韓語/英語)語言模型系列,該2.1B參數版本在韓語表現上超越同類模型,同時保持高效計算成本。
大型語言模型
Transformers 支持多種語言

K
kakaocorp
5,994
59
Dorna2 Llama3.1 8B Instruct
Dorna2-Llama3.1-8B-Instruct是由Part AI開發的基於Meta Llama 3.1 Instruct的8B參數大語言模型,專門針對波斯語進行了優化。
大型語言模型
Transformers 支持多種語言

D
PartAI
844
16
Daredevil 8B
其他
Daredevil-8B 是一個專為最大化 MMLU 得分而設計的超級融合模型,截至 2024 年 5 月 27 日,它是 MMLU 得分最高的 Llama 3 8B 模型。
大型語言模型
Transformers

D
mlabonne
238
39
E.star.7.b
Apache-2.0
基於Mistral架構的7B參數大語言模型,使用Unsloth和TRL庫高效訓練,在多項基準測試中表現優異。
大型語言模型
Transformers 英語

E
liminerity
86
2
Misted 7B
Apache-2.0
Misted-7B 是一個基於 OpenHermes-2-Mistral-7B 和 Mistral-7B-SlimOrca 融合的 7B 參數大語言模型,主要用於文本生成任務。
大型語言模型
Transformers 英語

M
Walmart-the-bag
386
8
Orca Mini 13b
orca_mini_13b 是一個基於多個高質量數據集訓練的文本生成模型,專注於指令跟隨和對話任務。
大型語言模型
Transformers 英語

O
pankajmathur
79
100
My QA
基於hfl/chinese-pert-large微調的問答模型,適用於中文問答任務
大型語言模型
Transformers

M
cgt
25
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98