M

Mamba 130m Hf

由state-spaces開發
Mamba是一個與transformers兼容的序列建模模型,具有高效的推理能力。
下載量 46.83k
發布時間 : 3/6/2024

模型概述

Mamba是一個基於狀態空間模型(SSM)的序列建模架構,適用於因果語言建模任務。該模型提供了優化的CUDA內核實現,支持高效的文本生成。

模型特點

高效推理
通過優化的CUDA內核實現高效推理,支持長序列處理
狀態空間架構
採用狀態空間模型(SSM)架構,適合序列建模任務
PEFT兼容
支持參數高效微調(PEFT)技術,如LoRA

模型能力

文本生成
語言建模
序列建模

使用案例

文本生成
對話生成
用於構建聊天機器人或對話系統
示例顯示能生成連貫的對話回覆
內容創作
輔助寫作和內容生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase