H

Hymba 1.5B Instruct

由nvidia開發
基於Hymba-1.5B-Base進行指令微調的15億參數模型,具備數學推理、函數調用、角色扮演等複雜任務處理能力
下載量 3,547
發布時間 : 10/31/2024

模型概述

融合開源指令數據集與內部合成數據訓練的指令微調模型,採用監督式微調與直接偏好優化聯合訓練

模型特點

混合注意力架構
每層並行集成標準注意力頭與Mamba狀態空間模型頭,提升長序列處理能力
元標記技術
前置標記實現全局交互,緩解傳統注意力機制的'強制關注'問題
高效設計
結合分組查詢注意力(GQA)、旋轉位置編碼(RoPE)和跨層KV共享技術
商業友好許可
採用NVIDIA開放模型許可協議,允許商業用途

模型能力

數學推理
函數調用
角色扮演
多輪對話
文本生成
指令理解

使用案例

智能助手
任務型對話系統
處理包含多步驟操作的複雜用戶請求
在SFT基準測試中優於同規模模型15%
教育應用
數學解題輔導
分步驟解釋數學問題解決方案
GSM8K測試集準確率達62.3%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase