S

Stripedhyena Hessian 7B

Developed by togethercomputer
条纹鬣狗-海森-7B是由Together Research开发的基于混合信号处理模型的Transformer替代方案,专为长上下文场景设计,提供更高效的训练和推理性能。
Downloads 38
Release Time : 11/21/2023

Model Overview

条纹鬣狗-海森-7B是一种新型序列模型,结合多头分组查询注意力机制与门控卷积模块,旨在超越传统Transformer架构,在短长上下文评估中均表现优异。

Model Features

长上下文支持
支持最长32k序列训练,可处理更长的提示词,适合长上下文场景。
高效推理
相比传统Transformer具有更低延迟、更快解码速度及更高吞吐量。
混合架构设计
结合多头分组查询注意力机制与门控卷积模块,优化训练与推理性能。

Model Capabilities

文本生成
长上下文处理
高效推理

Use Cases

自然语言处理
长文档摘要
生成长文档的简洁摘要,适合处理32k序列长度的文本。
在长上下文评估中表现优异。
对话系统
构建高效的对话系统,支持长对话上下文。
低延迟、高吞吐量。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase