# 低學習率優化

32b Glm4 Dans Personality Engine V1.3.0 TestArticle 1
MIT
基於THUDM/GLM-4-32B-Base-0414模型在Dans-DiscountModels/pretokenization-test-4數據集上微調的大語言模型
大型語言模型 Transformers
3
Dans-DiscountModels
38
2
Videomae Base Finetuned 1e 08 Bs4 Ep2
基於MCG-NJU/videomae-base微調的視頻理解模型,在未知數據集上進行了訓練
視頻處理 Transformers
V
EloiseInacio
14
0
Mnist Demo3
MIT
一個基於PyTorch和Diffusers庫的擴散模型,用於無條件生成手寫數字的黑白圖像。
圖像生成
M
BackTo2014
32
0
Florence 2 DocVQA
基於微軟Florence-2模型使用Docmatix數據集(5%數據量)微調1天的版本,適用於圖像文本理解任務
文本生成圖像 Transformers
F
impactframes
30
1
Retrocomicflux
Openrail
基於公共領域圖像訓練的Flux LoRA模型,專長於復古漫畫風格的人物描繪
圖像生成
R
renderartist
469
37
Florence 2 DocVQA
這是微軟Florence-2模型使用Docmatix數據集(5%數據量)以1e-6學習率微調1天后的版本
文本生成圖像 Transformers
F
HuggingFaceM4
3,096
60
Mbart Large 50 En Es Translation Lr 1e 05 Weight Decay 0.1
MIT
基於facebook/mbart-large-50微調的英語-西班牙語翻譯模型,在評估集上表現出色。
機器翻譯 Transformers
M
DrishtiSharma
20
0
Mbart Large 50 En Es Translation Lr 1e 05 Weight Decay 0.01
MIT
基於facebook/mbart-large-50微調的英語到西班牙語翻譯模型,在評估集上取得了45.09的BLEU分數。
機器翻譯 Transformers
M
DrishtiSharma
16
0
Mbart Large 50 En Es Translation Lr 1e 05 Weight Decay 0.0
MIT
該模型是基於facebook/mbart-large-50微調的英語到西班牙語翻譯模型,在評估集上取得了45.03的BLEU分數。
機器翻譯 Transformers
M
DrishtiSharma
27
0
Vit Model
Apache-2.0
基於google/vit-base-patch16-224-in21k在beans數據集上微調的視覺Transformer模型
圖像分類 Transformers
V
santiagoahl
13
0
Mt5 Base Turkish Summarization
Apache-2.0
基於google/mt5-base在mlsum/tu數據集上微調的土耳其語文本摘要模型
文本生成 Transformers
M
mukayese
249
6
Distilbert Token Itr0 1e 05 All 01 03 2022 14 33 33
Apache-2.0
該模型是基於DistilBERT在未指定數據集上微調的版本,主要用於文本分類任務。
大型語言模型 Transformers
D
ali2066
15
0
Cb
BERT是一種基於Transformer架構的預訓練語言模型,由Google開發。它通過雙向上下文理解文本,適用於多種自然語言處理任務。
文本分類 Transformers
C
kangnichaluo
14
0
Mrc Pretrained Roberta Large 1
KLUE-RoBERTa-large是基於RoBERTa架構的韓語預訓練語言模型,由韓國研究團隊開發,針對韓語自然語言處理任務進行了優化。
大型語言模型 Transformers
M
this-is-real
14
0
Mnli 1
BERT是一種基於Transformer架構的預訓練語言模型,由Google開發。該模型在多種自然語言處理任務中表現出色,包括文本分類、問答和命名實體識別等。
文本分類 Transformers
M
kangnichaluo
14
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase