B

Bamba 9B V1

ibm-ai-platformによって開発
Bamba-9BはMamba-2アーキテクチャに基づくデコーダ専用言語モデルで、2段階トレーニングを経ており、幅広いテキスト生成タスクに優れています。
ダウンロード数 16.19k
リリース時間 : 12/3/2024

モデル概要

Bamba-9Bは効率的な言語モデルで、2段階トレーニング手法を採用しています。第1段階ではDolma v1.7データセットの2兆トークンでトレーニングし、第2段階では性能向上のために追加で2000億トークンをトレーニングしました。

モデル特徴

2段階トレーニング
第1段階で2兆トークン、第2段階で2000億の高品質トークンでさらに最適化。
効率的なアーキテクチャ
Mamba-2アーキテクチャを基に、32層と4096の隠れ次元を持ち、4096のコンテキスト長をサポート。
量子化サポート
FP8量子化バージョンを提供し、メモリ使用量を大幅に削減し、推論効率を向上。

モデル能力

テキスト生成
言語理解
コンテキスト推論

使用事例

汎用テキスト生成
コンテンツ作成
記事、ストーリー、その他のクリエイティブなテキストコンテンツを生成。
Q&Aシステム
ユーザーからの様々な質問に回答。
教育
学習支援
複雑な概念の理解を助けたり、学習教材を生成。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase