M

Mamba 130m Hf

state-spacesによって開発
Mambaはtransformersと互換性のあるシーケンスモデリングモデルで、効率的な推論能力を備えています。
ダウンロード数 46.83k
リリース時間 : 3/6/2024

モデル概要

Mambaは状態空間モデル(SSM)に基づくシーケンスモデリングアーキテクチャで、因果言語モデリングタスクに適しています。このモデルは最適化されたCUDAカーネル実装を提供し、効率的なテキスト生成をサポートします。

モデル特徴

効率的な推論
最適化されたCUDAカーネルによる効率的な推論を実現し、長いシーケンス処理をサポート
状態空間アーキテクチャ
状態空間モデル(SSM)アーキテクチャを採用し、シーケンスモデリングタスクに適している
PEFT互換
LoRAなどのパラメータ効率的なファインチューニング(PEFT)技術をサポート

モデル能力

テキスト生成
言語モデリング
シーケンスモデリング

使用事例

テキスト生成
対話生成
チャットボットや対話システムの構築に使用
例では一貫性のある対話応答を生成できることが示されている
コンテンツ作成
執筆やコンテンツ生成の補助
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase