Z

Zamba2 2.7B

Zyphraによって開発
Zamba2-2.7Bは、状態空間とTransformerモジュールから構成される混合モデルで、Mamba2モジュールと共有アテンションモジュールを採用し、高性能と低遅延の特徴を持っています。
ダウンロード数 2,550
リリース時間 : 7/9/2024

モデル概要

Zamba2-2.7Bは混合アーキテクチャのモデルで、状態空間とTransformerモジュールを組み合わせ、Mamba2モジュールと共有アテンションモジュールによって高性能と低遅延の推論を実現します。

モデル特徴

混合アーキテクチャ
状態空間とTransformerモジュールを組み合わせ、Mamba2モジュールと共有アテンションモジュールを利用して性能を向上させます。
パラメータ最適化
共有アテンションの重みとLoRA投影器を適用することで、パラメータの数を抑えながら深度の特化を実現します。
高性能
パラメータが30億未満のモデルでトップクラスの性能を達成し、より大規模なモデルとも競争力を持ちます。
低遅延と小さなメモリ使用量
独特な混合SSMアーキテクチャにより、極低い推論遅延、高速な生成速度、および小さなメモリ使用量を実現します。

モデル能力

テキスト生成
コード生成
汎用言語理解

使用事例

汎用言語モデルの応用
質問応答システム
複雑な質問に答えるために使用され、例えば歴史イベントの分析など。
詳細で正確な回答を生成します。
コード生成
自然言語の記述に基づいてコード断片を生成します。
記述に合ったコードを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase