Gemma 3 4B It Qat GGUF
Google出品的Gemma 3 4B IT模型,支持多模態輸入和長上下文處理,適用於文本生成和圖像理解任務。
圖像生成文本
G
lmstudio-community
46.55k
10
Llavaguard V1.2 0.5B OV Hf
LlavaGuard-v1.2-0.5B-OV是一個基於圖像文本的模型,專注於內容安全評估,面向研究人員設計。
圖像生成文本
Safetensors
L
AIML-TUDA
1,945
4
EEVE Korean Instruct 10.8B V1.0 Gguf
Apache-2.0
EEVE-Korean-Instruct-10.8B-v1.0 是一個韓語指令微調的大型語言模型,基於 yanolja/EEVE-Korean-10.8B-v1.0 基礎模型開發,專注於韓語理解和生成任務。
大型語言模型
E
teddylee777
626
21
Tweety 7b Dutch V24a
Apache-2.0
Tweety-7b-dutch是一個專注於荷蘭語的基礎大語言模型,基於mistral架構,使用荷蘭語分詞器優化荷蘭語文本處理能力。
大型語言模型
Transformers 其他

T
Tweeties
1,568
13
Kanarya 750m
Apache-2.0
金絲雀-750M是一個預訓練的土耳其語GPT-J 750M模型,屬於土耳其數據倉庫計劃的一部分。
大型語言模型 其他
K
asafaya
2,749
10
Nekomata 14b
其他
基於Qwen-14B在混合日語和英語數據集上持續預訓練的大語言模型,顯著提升日語任務表現
大型語言模型
Transformers 支持多種語言

N
rinna
705
20
Geitje 7B
Apache-2.0
基於Mistral 7B的大規模開源荷蘭語模型,通過100億荷蘭語文本標記的增量訓練,顯著提升荷蘭語理解能力及本土知識覆蓋。
大型語言模型
Transformers 其他

G
Rijgersberg
891
19
Colossal LLaMA 2 7b Base
基於LLaMA-2的中英雙語開源大語言模型,經過約85億token的持續預訓練,支持4096 token的上下文窗口。
大型語言模型
Transformers 支持多種語言

C
hpcai-tech
147
76
Starcoderbase 7b
Openrail
StarCoderBase-7B是一個參數規模為70億的代碼生成模型,支持80多種編程語言,專注於代碼補全和生成任務。
大型語言模型
Transformers 其他

S
bigcode
2,128
33
Mpt 7b 8k Instruct
Apache-2.0
MPT-7B-Instruct-8k 是一款用於長格式指令遵循的模型,尤其擅長對較長文檔進行問答和總結。
大型語言模型
Transformers 其他

M
mosaicml
2,513
27
Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP15
Bsd-3-clause
基於Long-T5架構的大規模摘要生成模型,專門針對書籍和長文檔摘要任務進行優化
文本生成
Transformers

L
pszemraj
17
0
Long T5 Tglobal Base 16384 Booksum V12
Bsd-3-clause
基於T5架構優化的長文本摘要生成模型,支持處理長達16384個token的輸入,在書籍摘要任務上表現優異。
文本生成
Transformers

L
pszemraj
109
4
Long T5 Tglobal Base 16384 Book Summary
Bsd-3-clause
基於Long-T5架構的書籍摘要生成模型,支持處理長文檔並生成高質量摘要。
文本生成
L
pszemraj
24.19k
134
Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP
Apache-2.0
基於Long-T5架構的大規模摘要生成模型,專門針對長文檔摘要任務優化,支持16384個token的上下文長度。
文本生成
Transformers

L
pszemraj
65
1
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98