Progen2 Xlarge
Bsd-3-clause
ProGen2-xlarge是基於Nijkamp等人提出的基礎模型,經過配置和前向傳播修改的蛋白質生成模型。
大型語言模型
Transformers

P
hugohrban
38
1
Progen2 Base
Bsd-3-clause
ProGen2-base是基於Nijkamp等人研究的蛋白質生成模型,支持蛋白質序列的生成和預測。
大型語言模型
Transformers

P
hugohrban
4,937
3
Myrrh Solar 10.7b 3.0
Apache-2.0
由MoAData公司開發的醫療領域大語言模型,使用DPO方法在自制的醫療數據集上訓練。
大型語言模型
Transformers 韓語

M
MoaData
15.39k
3
Progen2 Small
Bsd-3-clause
ProGen2-small是基於Nijkamp等人研究的蛋白質生成模型,經過輕微調整配置和前向傳播流程的鏡像版本。
大型語言模型
Transformers

P
hugohrban
6,505
2
Mamba 790m Hf
Mamba 是一個與 transformers 兼容的高效序列模型,具有 7.9 億參數,適用於因果語言建模任務。
大型語言模型
Transformers

M
state-spaces
6,897
4
Vortex 3b
其他
vortex-3b是由OEvortex開發的27.8億參數因果語言模型,基於Pythia-2.8b模型並在Vortex-50k數據集上微調。
大型語言模型
Transformers 英語

V
OEvortex
16
5
Open Calm 3b
OpenCALM是由CyberAgent公司開發的基於日語數據集預訓練的僅解碼器語言模型系列中的3B參數版本。
大型語言模型
Transformers 日語

O
cyberagent
850
20
Pythia 1b
Apache-2.0
Pythia-1B是EleutherAI開發的可解釋性研究專用語言模型,屬於Pythia套件中的10億參數規模版本,基於The Pile數據集訓練。
大型語言模型
Transformers 英語

P
EleutherAI
79.69k
38
Pythia 6.9b
Apache-2.0
Pythia-6.9B是EleutherAI開發的大規模語言模型,屬於Pythia可擴展套件的一部分,專為促進可解釋性研究而設計。
大型語言模型
Transformers 英語

P
EleutherAI
46.72k
54
Pythia 410m
Apache-2.0
Pythia是EleutherAI開發的一系列因果語言模型,專為可解釋性研究設計,包含從7000萬到120億參數的8種規模,提供154個訓練檢查點
大型語言模型
Transformers 英語

P
EleutherAI
83.28k
25
Pythia 2.8b
Apache-2.0
Pythia-28億是EleutherAI開發的可擴展語言模型套件中的一員,專為促進大語言模型的可解釋性研究而設計。該模型基於Transformer架構,在The Pile數據集上訓練,具有28億參數。
大型語言模型
Transformers 英語

P
EleutherAI
40.38k
30
Pythia 1.4b
Apache-2.0
Pythia-1.4B是EleutherAI開發的12億參數因果語言模型,屬於Pythia規模套件的一部分,專為可解釋性研究設計。
大型語言模型
Transformers 英語

P
EleutherAI
60.98k
23
Gpt2 Base Thai
MIT
基於GPT-2架構的泰語因果語言模型,在OSCAR數據集上訓練
大型語言模型 其他
G
flax-community
1,026
10
Gpt Neo 1.3B Vietnamese News
這是一個基於越南新聞數據訓練的GPT-Neo 1.3B參數規模的越南語因果語言模型
大型語言模型
Transformers 其他

G
VietAI
990
28
Skillet
基於Skillet樂隊歌詞微調的GPT-2語言模型,用於生成類似風格的文本內容
大型語言模型 英語
S
huggingartists
24
0
The Notorious Big
基於聲名狼藉先生(The Notorious B.I.G.)歌詞微調的GPT-2語言模型,可生成類似風格的歌詞文本
大型語言模型 英語
T
huggingartists
16
0
Tool
基於Tool樂隊歌詞訓練的GPT-2語言模型,可生成風格相似的歌詞文本
大型語言模型 英語
T
huggingartists
14
1
Gpt Neo 1.3B
MIT
GPT-Neo 1.3B是由EleutherAI開發的13億參數自迴歸語言模型,基於GPT-3架構設計,擅長文本生成任務
大型語言模型 英語
G
EleutherAI
208.93k
298
Rugpt3medium Sum Gazeta
Apache-2.0
基於rugpt3medium_based_on_gpt2的俄語抽象摘要生成模型,專門針對Gazeta數據集進行訓練
文本生成
Transformers 其他

R
IlyaGusev
1,228
4
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98