M

Mambahermes 3B GGUF

dranger003によって開発
Mambaアーキテクチャに基づく3Bパラメータの言語モデルで、効率的なテキスト生成タスクに特化
ダウンロード数 60
リリース時間 : 3/9/2024

モデル概要

これはMambaアーキテクチャに基づく3Bパラメータの言語モデルで、GGUF形式の量子化を採用し、テキスト生成タスクに適しています。モデルは一定のメモリ使用量を特徴とし、推論速度はコンテキスト長の影響を受けません。

モデル特徴

一定のメモリ使用量
Mambaアーキテクチャは一定のメモリ使用量を特徴とし、処理するトークン数が増えてもメモリ消費量が増加しません
安定した推論速度
Transformerアーキテクチャとは異なり、Mambaの推論速度はコンテキスト長が増加しても低下しません
量子化サポート
モデルはGGUF形式の量子化をサポートしており、リソースが限られたデバイスでも実行可能です

モデル能力

テキスト生成
言語理解

使用事例

テキスト生成
対話システム
チャットボットや対話アシスタントの構築に使用可能
コンテンツ作成
記事、ストーリー、その他のテキストコンテンツの生成を補助
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase