F

Fr Wiki Mlm 42

由fpadovani開發
基於未知數據集微調的生成模型,具體訓練數據和用途信息缺失
下載量 42
發布時間 : 4/7/2025

模型概述

該模型是基於transformers庫訓練的生成模型,可能用於文本生成任務。訓練過程中使用了線性學習率調度和Adam優化器。

模型特點

線性學習率調度
訓練過程中使用了線性學習率調度策略,包含40000步的預熱階段
Adam優化器
採用帶betas=(0.9,0.999)和epsilon=1e-08的Adam優化器進行訓練
梯度累積
使用梯度累積技術(步數=2)實現更大的有效批大小(32)

模型能力

文本生成

使用案例

文本生成
通用文本生成
可用於生成各類文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase