A

Arsh Llm Gpt

由arshiaafshani開發
基於GPT-2架構開發的大語言模型,專注於科研輔助功能,在有限硬件條件下完成訓練
下載量 19
發布時間 : 5/14/2025

模型概述

Arsh大語言模型是採用GPT-2架構開發的科研輔助項目,通過分階段訓練策略在有限硬件條件下完成訓練,旨在證明大型模型未必需要頂級硬件支持

模型特點

有限硬件訓練
在T4 GPU上通過分階段訓練策略完成模型訓練,每個階段耗時1-2天
多階段訓練
訓練過程分為8個階段,總耗時約4-5天,實現高效訓練
混合數據集
使用olmo-mix-1124數據集進行訓練,並結合多個開源對話數據集微調

模型能力

文本生成
科研輔助

使用案例

科研
科研文獻輔助
輔助科研人員進行文獻分析和內容生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase