B

Bitnet B1.58 2B 4T Gguf

由microsoft開發
微軟研究院開發的首個開源、原生1比特的大語言模型,參數規模達20億,在4萬億token的語料庫上訓練而成。
下載量 25.77k
發布時間 : 4/15/2025

模型概述

BitNet b1.58 2B4T是一個原生1比特的大語言模型,證明了原生1比特大語言模型能夠達到與相似規模的主流開放權重、全精度模型相當的性能,同時在計算效率(內存、能耗、延遲)上具有顯著優勢。

模型特點

原生1.58比特量化
權重通過絕對值均值量化到三元值{-1, 0, +1},激活通過絕對值最大值量化到8比特整數(按token)。
高效計算
在計算效率(內存、能耗、延遲)上具有顯著優勢,內存使用僅為0.4GB,延遲低至29ms(CPU解碼)。
大規模訓練
在4萬億token的語料庫上訓練而成,證明了原生1比特大語言模型能夠達到與相似規模的主流開放權重、全精度模型相當的性能。
長上下文支持
最大序列長度為4096個token,支持長上下文任務。

模型能力

文本生成
聊天對話
指令遵循
數學推理
常識問答

使用案例

對話系統
AI助手
作為AI助手進行對話,回答用戶問題。
能夠生成流暢、連貫的對話響應。
教育
數學問題解答
解答數學問題,包括GSM8K和MATH-500等數學推理任務。
在GSM8K和MATH-500等數學推理任務上表現優異。
問答系統
常識問答
回答常識性問題,如ARC挑戰賽、OpenbookQA等任務。
在ARC挑戰賽、OpenbookQA等任務上表現良好。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase