L

Llama 1B Dj Refine 150B

由datajuicer開發
基於OpenLLaMA架構,在Data-Juicer精煉的RedPajama和Pile數據集上預訓練的大語言模型,性能超越同類1.3B參數規模模型。
下載量 2,834
發布時間 : 10/30/2023

模型概述

本模型是Data-Juicer發佈的參考級大語言模型,採用LLaMA-1.3B架構,在精煉數據集上訓練,適用於多種自然語言處理任務。

模型特點

高質量訓練數據
使用Data-Juicer精煉的RedPajama和Pile數據集,數據質量優於原始數據集
高效訓練
僅用1500億token訓練即達到優異性能,訓練效率高於同類模型
性能優越
在16項HELM基準測試中平均得分34.21,超越Falcon-1.3B、Pythia-1.4B等同類模型

模型能力

文本生成
語言理解
知識問答
文本摘要

使用案例

研究應用
語言模型基準測試
用於評估和比較不同語言模型的性能
在HELM基準測試中表現優異
商業應用
智能客服
用於構建英語智能客服系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase