B

Biggie SmoLlm 0.15B Base

由 nisten 开发
基于SmolLM-135M的微型语言模型升级版,参数规模0.18B,适用于训练场景,具有优异的推理速度和连贯性表现
下载量 944
发布时间 : 7/29/2024

模型简介

这是一个通过半自动化持续融合技术构建的语言模型,具有更优的连贯性,是进阶训练的绝佳选择。模型融合了进化式模型融合、BitNet集成和实验性GrokAdamW优化器等多项前沿技术。

模型特点

高效推理
单CPU核即可实现160token/秒的推理速度,无需GPU支持
先进优化技术
融合进化式模型融合、BitNet集成和实验性GrokAdamW优化器等多项前沿技术
轻量化
量化后模型仅164MB,适合资源受限环境部署
连贯性表现
即使在默认温度参数下,前100个token也表现连贯

模型能力

文本生成
指令理解
技术问答

使用案例

科研应用
科学问答
回答NASA JPL科学家提出的技术问题
能够生成符合科学背景的连贯回答
教育
教学辅助
生成技术概念的解释和示例
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase