M

Microllama

由keeeeenw開發
MicroLlama是一個由個人開發者keeeeenw在500美元預算內預訓練的3億參數Llama模型,專注於英語文本生成任務。
下載量 2,955
發布時間 : 3/29/2024

模型概述

這是一個小型化的Llama模型,旨在證明在有限資源下也能訓練出有效的大型語言模型。模型基於TinyLlama項目修改,移除了代碼相關數據,專注於通用文本生成。

模型特點

低成本訓練
在500美元預算內完成訓練,證明小型化LLM的可行性
完全開源
使用完全開源的數據集和模型架構,無專有數據依賴
輕量級
僅3億參數,適合資源有限的環境部署

模型能力

英語文本生成
問答系統
語言理解

使用案例

教育研究
小型LLM研究
作為研究資源受限環境下LLM表現的案例
證明小型模型也能達到一定性能
應用開發
輕量級聊天機器人
適用於移動端或邊緣設備的對話應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase