Mambaoutaiオープンソースモデル - フランス語と英語両方とコードデータを網羅する小規模チェックポイントを無料で利用可能

ホーム

Mambaoutai

lightonaiによって開発

Mambaoutaiは、フランス語、英語、コードをカバーするトレーニングデータを持つ一連の小型Mambaチェックポイントで、コミュニティの探求を目的としています。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #多言語生成 #効率的な推論 #命令微調整

ダウンロード数 29

リリース時間 : 3/18/2024

モデル概要

MambaoutaiはMambaアーキテクチャに基づく小型言語モデルで、フランス語と英語のテキスト生成をサポートし、コード生成や自然言語処理タスクに使用できます。

モデル特徴

多言語サポート

フランス語と英語の2言語のテキスト生成をサポート

効率的な推論

16億パラメータのみで、CPU上で合理的な速度で動作可能

トレーニングチェックポイント

研究と分析を容易にするため、トレーニングプロセス中の複数のチェックポイントを提供

デバイスサイド推論

llama.cppなどのフレームワーク上での実行をサポートし、エッジデバイスに適しています

モデル能力

テキスト生成

コード生成

多言語処理

使用事例

教育

言語学習支援

フランス語または英語の学習教材を生成

コンテンツ作成

記事の続き書き

プロンプトに基づいて一貫性のあるテキストコンテンツを生成

プログラミング支援

コード補完

コンテキストに基づいてコードスニペットを生成

🚀 Mambaoutai 1.6B

Mambaoutaiは、このブログ記事で説明されているすべての実験とトレーニングの結果です。この記事では、このモデルシリーズに関するすべての詳細が共有されています。Mambaoutaiは、フランス語、英語、コードでトレーニングされた、コミュニティが探索するために公開された一連の小規模なMambaチェックポイントです。WSDスケジューラを使用して2つの異なる減衰フェーズを実行し、命令データを使用して事前学習されたモデルチェックポイントと、命令データを使用せずに事前学習されたモデルチェックポイントの両方を公開しています。

🚀 クイックスタート

📦 インストール

transformers=4.39.0がリリースされるまで、mainからtransformersをインストールする必要があります。

pip install git+https://github.com/huggingface/transformers@main

また、causal-conv1dとmamba-ssmの両方を以下のコマンドでインストールすることをおすすめします。

pip install causal-conv1d>=1.2.0
pip install mamba-ssm>=1.2.0

これらの2つのうちどちらかがインストールされていない場合、"eager"実装が使用されます（推奨しません）。それ以外の場合は、より最適化されたCUDAカーネルが使用されます。

💻 使用例

基本的な使用法

モデルからテキストを生成するには、次のコードを使用します。

from transformers import MambaConfig, MambaForCausalLM, AutoTokenizer
import torch

if model_has_instruct_data:
	# use chat tokens
	prompt = ”<start_user>Tell me something about Paris.<end_message><start_assistant>”
else:
	# prompt the non-instructed tuned model gently
	prompt = ”This is a text about Paris. Paris is”

tokenizer = AutoTokenizer.from_pretrained("lightonai/mambaoutai")
model = MambaForCausalLM.from_pretrained("lightonai/mambaoutai")
input_ids = tokenizer(prompt, return_tensors="pt")["input_ids"]

out = model.generate(input_ids, max_new_tokens=10)
print(tokenizer.batch_decode(out))

高度な使用法

リポジトリのブランチには、いくつかのトレーニングチェックポイントがあります。トレーニング中のある時点のモデルに対応するブランチです。これらのトレーニングチェックポイントを使用して推論を行うには、from_pretrainedメソッドにrevisionパラメータを追加します。例えば、事前学習の30000ステップ後のモデルチェックポイントをロードするには、次のコードを使用できます。

from transformers import MambaConfig, MambaForCausalLM, AutoTokenizer
import torch

tokenizer = AutoTokenizer.from_pretrained("lightonai/mambaoutai", revision="pre-30000")
model = MambaForCausalLM.from_pretrained("lightonai/mambaoutai", revision="pre-30000")
input_ids = tokenizer("What is a mamba?", return_tensors="pt")["input_ids"]

out = model.generate(input_ids, max_new_tokens=10)
print(tokenizer.batch_decode(out))

デバイス上での推論

Mambaoutaiはパラメータが1.6Bしかないため、CPUでも妥当な速度で実行できます。以下は、llama.cppで実行する方法の例です。

# Clone llama.cpp repository and compile it from source
git clone https://github.com/ggerganov/llama.cpp\
cd llama.cpp
make

# Create a venv and install dependencies
conda create -n mamba-cpp python=3.10
conda activate mamba-cpp
pip install -r requirements/requirements-convert-hf-to-gguf.txt

# Download the weights, tokenizer, config, tokenizer_config and special_tokens_map from this repo and
# put them in a directory 'Mambaoutai/' 
mkdir Mambaoutai

# Convert the weights to GGUF format
python convert-hf-to-gguf.py Mambaoutai

# Run inference with a prompt
./main -m Mambaoutai/ggml-model-f16.gguf -p "Building a website can be done in 10 simple steps:\nStep 1:" -n 400 -e -ngl 1

🔧 技術詳細

トレーニングハードウェア

命令データのないモデルチェックポイントは、OVH Cloudが提供するNVIDIA DGX H100で完全にトレーニングされています。一方、命令データを使用した減衰フェーズは、Orange Cloud Avenueの8xH100を搭載したHPE Crayで実行されています。アブレーション実験は、MeluXinaの16ノード（4xA100 - 40GB）で行われました。

モデルのハイパーパラメータ

モデルのハイパーパラメータの詳細は、以下の表に示されています。

パラメータ	値
d_model	2688
n_layer	28
vocab_size	65024
context_len	4096
rms_norm	true
residual_in_fp32	true
fused_add_norm	true
conv_kernel	4
d_inner	5376
state_size	16
dtype	bfloat16
tie_word_embeddings	false
non embeddings params	1.27B

📄 ライセンス

このプロジェクトは、Apache-2.0ライセンスの下で公開されています。