O

Open Llama 3b

由openlm-research開發
OpenLLaMA是Meta AI LLaMA大語言模型的開源復現版本,提供3B、7B和13B參數規模的預訓練模型
下載量 26.20k
發布時間 : 6/7/2023

模型概述

基於RedPajama數據集訓練的開放權重語言模型,完全復現LLaMA架構和訓練方法,適用於文本生成和語言理解任務

模型特點

開源復現
完全復現Meta AI的LLaMA模型架構和訓練方法,但使用開放數據集和寬鬆許可證
多規模選擇
提供3B、7B和13B三種參數規模的模型版本,適應不同計算需求
高性能訓練
使用TPU-v4集群訓練,優化訓練吞吐量達到每芯片2200+token/秒
完整訓練流程
包含從零開始訓練的分詞器和模型權重,無需依賴原始LLaMA資源

模型能力

文本生成
問答系統
語言理解
少樣本學習

使用案例

教育研究
學術問答
回答科學、歷史等領域的知識性問題
在多項評估中表現與原始LLaMA相當
內容創作
文本續寫
根據給定提示生成連貫的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase