B

Bonsai

由deepgrove開發
盆景是一個擁有5億參數的小型三值權重語言模型,採用Llama架構和Mistral分詞器,訓練使用的標記數不到50億。
下載量 113
發布時間 : 3/21/2025

模型概述

盆景是由deepgrove訓練的小型三值權重語言模型,主要使用DCLM-Pro和Fineweb-Edu進行訓練,標誌著效率的新範式。

模型特點

三值權重設計
修改了線性層以支持三值權重,提高了模型的效率。
高效訓練
訓練使用的標記數不到50億,標誌著效率的新範式。
小型模型
僅5億參數,適合資源有限的環境。

模型能力

文本生成
語言理解

使用案例

教育
知識問答
用於回答簡單的知識性問題,如'法國的首都是哪裡?'
研究
模型效率研究
用於研究三值權重模型在效率和性能上的表現。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase