B

Biggie SmoLlm 0.15B Base

由nisten開發
基於SmolLM-135M的微型語言模型升級版,參數規模0.18B,適用於訓練場景,具有優異的推理速度和連貫性表現
下載量 944
發布時間 : 7/29/2024

模型概述

這是一個通過半自動化持續融合技術構建的語言模型,具有更優的連貫性,是進階訓練的絕佳選擇。模型融合了進化式模型融合、BitNet集成和實驗性GrokAdamW優化器等多項前沿技術。

模型特點

高效推理
單CPU核即可實現160token/秒的推理速度,無需GPU支持
先進優化技術
融合進化式模型融合、BitNet集成和實驗性GrokAdamW優化器等多項前沿技術
輕量化
量化後模型僅164MB,適合資源受限環境部署
連貫性表現
即使在默認溫度參數下,前100個token也表現連貫

模型能力

文本生成
指令理解
技術問答

使用案例

科研應用
科學問答
回答NASA JPL科學家提出的技術問題
能夠生成符合科學背景的連貫回答
教育
教學輔助
生成技術概念的解釋和示例
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase