M

Mamba Gpt 3b

由CobraMamba開發
基於open-lama微調的3B參數大語言模型,性能超越原版並媲美llama-7b
下載量 653
發布時間 : 6/12/2023

模型概述

對open-lama模型進行微調優化的3B參數大語言模型,在多項評測任務中表現優異,支持文本生成等自然語言處理任務

模型特點

高效微調
通過對open-lama模型精細微調,在多個評估子任務中超越原始模型表現
小體積高性能
僅3B參數規模卻達到與llama-7b相當的模型性能
優化推理配置
提供溫度調節、重複懲罰等精細化生成參數控制

模型能力

文本生成
問答系統
知識推理

使用案例

智能問答
健康知識問答
回答關於健康生活的常識性問題
如示例中關於飲水健康的回答
內容創作
短文生成
根據提示生成連貫的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase