Bitnet B1 58 Large
MIT
BitNet b1.58是一種1位大語言模型,參數規模為30億,使用RedPajama數據集訓練了1000億個token。
大型語言模型
Transformers

B
1bitLLM
10.17k
95
Bitnet B1 58 3B
MIT
BitNet b1.58是一種1.58位量化的大語言模型,通過量化權重到{-1,0,1}三值實現高效推理。該模型復現了原論文結果,在RedPajama數據集上訓練了1000億token。
大型語言模型
Transformers

B
1bitLLM
1,109
249
Vda Fine Tuned 2
該模型是基於GroNLP/gpt2-small-italian微調的版本,適用於意大利語文本生成任務。
大型語言模型
Transformers

V
calogero-jerik-scozzaro
15
1
Gpt2 Wikitext2
MIT
基於GPT-2架構在wikitext2數據集上微調的語言模型
大型語言模型
Transformers

G
dnarqq
63
1
Ptt5 Small Portuguese Keyword Extractor V2
MIT
這是一個支持葡萄牙語的模型,具體功能和用途未明確說明。
大型語言模型
Transformers 其他

P
cnmoro
26
1
Ernie 3.0 Xbase Zh
ERNIE 3.0是一個面向語言理解與生成的大規模知識增強預訓練模型,由百度開發。
大型語言模型
Transformers 中文

E
nghuyong
14.27k
20
Roberta Base Serbian
這是一個基於srWaC預訓練的塞爾維亞語(西裡爾字母和拉丁字母)RoBERTa模型,適用於下游任務微調。
大型語言模型
Transformers 其他

R
KoichiYasuoka
20
1
Chinese Pert Base
PERT是一個基於BERT的中文預訓練模型,專注於提升中文文本處理能力。
大型語言模型
Transformers 中文

C
hfl
131
13
Question Intimacy
大型語言模型 英語
Q
pedropei
92
0
Koelectra Base Generator
Apache-2.0
KoELECTRA是一個基於ELECTRA架構的韓語預訓練語言模型,由monologg開發。該模型作為生成器部分,專注於韓語文本的表示學習。
大型語言模型
Transformers 韓語

K
monologg
31
0
Bert Base Cased Wikitext2
Apache-2.0
該模型是基於bert-base-cased在wikitext2數據集上微調的版本,主要用於文本處理任務。
大型語言模型
Transformers

B
thyagosme
41
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98