H

Hymba 1.5B Base

Developed by nvidia
Hymba-1.5B-BaseはNVIDIAが開発した基礎テキスト生成モデルで、Mambaとアテンションヘッドを組み合わせたハイブリッドアーキテクチャを採用し、様々な自然言語生成タスクに適しています。
Downloads 3,492
Release Time : 10/9/2024

Model Overview

このモデルは並列動作するMambaとアテンションヘッドを組み合わせたハイブリッドアーキテクチャを採用し、メタトークンによるモデル効率向上を実現し、多様な自然言語生成タスクをサポートします。

Model Features

ハイブリッドアーキテクチャ
Mambaとアテンションヘッドの並列処理を組み合わせ、モデル効率を向上させます。
メタトークン
入力シーケンス前に配置可能な学習可能なトークンで、重要な情報を保持しアテンション負荷を軽減します。
効率的なメモリ使用
クロスレイヤーKV共有とグローバル-ローカルアテンションメカニズムにより、メモリと計算効率を最適化します。

Model Capabilities

テキスト生成
自然言語処理
マルチタスク処理

Use Cases

自然言語生成
対話生成
自然な対話応答を生成するために使用されます。
20億パラメータ以下の公開モデル中最も優れた性能を発揮します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase