S

Stripedhyena Hessian 7B

由togethercomputer開發
條紋鬣狗-海森-7B是由Together Research開發的基於混合信號處理模型的Transformer替代方案,專為長上下文場景設計,提供更高效的訓練和推理性能。
下載量 38
發布時間 : 11/21/2023

模型概述

條紋鬣狗-海森-7B是一種新型序列模型,結合多頭分組查詢注意力機制與門控捲積模塊,旨在超越傳統Transformer架構,在短長上下文評估中均表現優異。

模型特點

長上下文支持
支持最長32k序列訓練,可處理更長的提示詞,適合長上下文場景。
高效推理
相比傳統Transformer具有更低延遲、更快解碼速度及更高吞吐量。
混合架構設計
結合多頭分組查詢注意力機制與門控捲積模塊,優化訓練與推理性能。

模型能力

文本生成
長上下文處理
高效推理

使用案例

自然語言處理
長文檔摘要
生成長文檔的簡潔摘要,適合處理32k序列長度的文本。
在長上下文評估中表現優異。
對話系統
構建高效的對話系統,支持長對話上下文。
低延遲、高吞吐量。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase