# 因果語言模型

Progen2 Xlarge
Bsd-3-clause
ProGen2-xlarge是基於Nijkamp等人提出的基礎模型,經過配置和前向傳播修改的蛋白質生成模型。
大型語言模型 Transformers
P
hugohrban
38
1
Progen2 Base
Bsd-3-clause
ProGen2-base是基於Nijkamp等人研究的蛋白質生成模型,支持蛋白質序列的生成和預測。
大型語言模型 Transformers
P
hugohrban
4,937
3
Myrrh Solar 10.7b 3.0
Apache-2.0
由MoAData公司開發的醫療領域大語言模型,使用DPO方法在自制的醫療數據集上訓練。
大型語言模型 Transformers 韓語
M
MoaData
15.39k
3
Progen2 Small
Bsd-3-clause
ProGen2-small是基於Nijkamp等人研究的蛋白質生成模型,經過輕微調整配置和前向傳播流程的鏡像版本。
大型語言模型 Transformers
P
hugohrban
6,505
2
Mamba 790m Hf
Mamba 是一個與 transformers 兼容的高效序列模型,具有 7.9 億參數,適用於因果語言建模任務。
大型語言模型 Transformers
M
state-spaces
6,897
4
Vortex 3b
其他
vortex-3b是由OEvortex開發的27.8億參數因果語言模型,基於Pythia-2.8b模型並在Vortex-50k數據集上微調。
大型語言模型 Transformers 英語
V
OEvortex
16
5
Open Calm 3b
OpenCALM是由CyberAgent公司開發的基於日語數據集預訓練的僅解碼器語言模型系列中的3B參數版本。
大型語言模型 Transformers 日語
O
cyberagent
850
20
Pythia 1b
Apache-2.0
Pythia-1B是EleutherAI開發的可解釋性研究專用語言模型,屬於Pythia套件中的10億參數規模版本,基於The Pile數據集訓練。
大型語言模型 Transformers 英語
P
EleutherAI
79.69k
38
Pythia 6.9b
Apache-2.0
Pythia-6.9B是EleutherAI開發的大規模語言模型,屬於Pythia可擴展套件的一部分,專為促進可解釋性研究而設計。
大型語言模型 Transformers 英語
P
EleutherAI
46.72k
54
Pythia 410m
Apache-2.0
Pythia是EleutherAI開發的一系列因果語言模型,專為可解釋性研究設計,包含從7000萬到120億參數的8種規模,提供154個訓練檢查點
大型語言模型 Transformers 英語
P
EleutherAI
83.28k
25
Pythia 2.8b
Apache-2.0
Pythia-28億是EleutherAI開發的可擴展語言模型套件中的一員,專為促進大語言模型的可解釋性研究而設計。該模型基於Transformer架構,在The Pile數據集上訓練,具有28億參數。
大型語言模型 Transformers 英語
P
EleutherAI
40.38k
30
Pythia 1.4b
Apache-2.0
Pythia-1.4B是EleutherAI開發的12億參數因果語言模型,屬於Pythia規模套件的一部分,專為可解釋性研究設計。
大型語言模型 Transformers 英語
P
EleutherAI
60.98k
23
Gpt2 Base Thai
MIT
基於GPT-2架構的泰語因果語言模型,在OSCAR數據集上訓練
大型語言模型 其他
G
flax-community
1,026
10
Gpt Neo 1.3B Vietnamese News
這是一個基於越南新聞數據訓練的GPT-Neo 1.3B參數規模的越南語因果語言模型
大型語言模型 Transformers 其他
G
VietAI
990
28
Skillet
基於Skillet樂隊歌詞微調的GPT-2語言模型,用於生成類似風格的文本內容
大型語言模型 英語
S
huggingartists
24
0
The Notorious Big
基於聲名狼藉先生(The Notorious B.I.G.)歌詞微調的GPT-2語言模型,可生成類似風格的歌詞文本
大型語言模型 英語
T
huggingartists
16
0
Tool
基於Tool樂隊歌詞訓練的GPT-2語言模型,可生成風格相似的歌詞文本
大型語言模型 英語
T
huggingartists
14
1
Gpt Neo 1.3B
MIT
GPT-Neo 1.3B是由EleutherAI開發的13億參數自迴歸語言模型,基於GPT-3架構設計,擅長文本生成任務
大型語言模型 英語
G
EleutherAI
208.93k
298
Rugpt3medium Sum Gazeta
Apache-2.0
基於rugpt3medium_based_on_gpt2的俄語抽象摘要生成模型,專門針對Gazeta數據集進行訓練
文本生成 Transformers 其他
R
IlyaGusev
1,228
4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase