H

Hymba 1.5B Base

nvidiaによって開発
Hymba-1.5B-BaseはNVIDIAが開発した基礎テキスト生成モデルで、Mambaとアテンションヘッドを組み合わせたハイブリッドアーキテクチャを採用し、様々な自然言語生成タスクに適しています。
ダウンロード数 3,492
リリース時間 : 10/9/2024

モデル概要

このモデルは並列動作するMambaとアテンションヘッドを組み合わせたハイブリッドアーキテクチャを採用し、メタトークンによるモデル効率向上を実現し、多様な自然言語生成タスクをサポートします。

モデル特徴

ハイブリッドアーキテクチャ
Mambaとアテンションヘッドの並列処理を組み合わせ、モデル効率を向上させます。
メタトークン
入力シーケンス前に配置可能な学習可能なトークンで、重要な情報を保持しアテンション負荷を軽減します。
効率的なメモリ使用
クロスレイヤーKV共有とグローバル-ローカルアテンションメカニズムにより、メモリと計算効率を最適化します。

モデル能力

テキスト生成
自然言語処理
マルチタスク処理

使用事例

自然言語生成
対話生成
自然な対話応答を生成するために使用されます。
20億パラメータ以下の公開モデル中最も優れた性能を発揮します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase