Sundial Base 128m
Apache-2.0
日晷是一系列生成式時間序列基礎模型,能夠對確定性預測和概率預測進行零樣本推理。
氣候模型
Safetensors
S
thuml
214
5
Plamo 2 1b
Apache-2.0
PLaMo 2 1B是由Preferred Elements公司開發的10億參數模型,基於英文和日文數據集進行預訓練,採用混合架構結合Mamba和滑動窗口注意力機制。
大型語言模型
Transformers 支持多種語言

P
pfnet
1,051
31
Openelm 450M
OpenELM是一組開放的高效語言模型,採用分層縮放策略優化參數分配,提升模型精度。提供2.7億至30億參數的預訓練及指令調優版本。
大型語言模型
Transformers

O
apple
857
26
Calm2 7b
Apache-2.0
CyberAgentLM2 是一個僅解碼器的語言模型,基於公開可用的日語和英語數據集,預訓練了1.3萬億個token。
大型語言模型
Transformers 支持多種語言

C
cyberagent
748
28
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98