L

Llama 3 6B V0.1

由prince-canuma開發
全球首個60億參數的Llama-3基礎模型,通過降級循環技術從Meta-Llama-3-8B創建,並在10億英文文本標記上進行了持續預訓練
下載量 14
發布時間 : 5/17/2024

模型概述

基於Llama-3架構的6B參數模型,適用於多種場景的指令和對話應用,如編程助手、RAG、函數調用等

模型特點

降級循環技術
通過從大型預訓練模型檢查點創建不同規模的新LLM,複製部分權重並初始化較小模型
高效預訓練
在FineWeb的10億純英文文本標記上進行了持續預訓練,取得了較低的損失值
多場景適用
可用於創建編程助手、RAG、函數調用等多種應用場景的指令和對話版本

模型能力

文本生成
編程輔助
問答系統
知識檢索

使用案例

編程開發
編程助手
幫助開發者解決編程問題,提供代碼示例
能夠生成Python等語言的代碼片段
知識問答
技術問答
回答技術相關問題
能夠準確回答Python語言相關的問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase