M

Mamba 370m Hf

由 state-spaces 开发
Mamba是一个基于状态空间模型(SSM)的高效语言模型,具有线性时间复杂度的序列建模能力。
下载量 6,895
发布时间 : 3/6/2024

模型简介

Mamba是一个与HuggingFace Transformers兼容的语言模型,采用创新的状态空间架构,特别适合长序列处理任务。

模型特点

高效序列建模
采用状态空间架构,具有线性时间复杂度的序列处理能力
CUDA优化
支持优化的CUDA内核实现,提高推理效率
兼容Transformers
完全兼容HuggingFace Transformers生态系统

模型能力

文本生成
语言建模
长序列处理

使用案例

文本生成
对话生成
生成连贯的对话响应
示例中展示了流畅的对话延续能力
内容创作
辅助写作和创意内容生成
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase