Falcon-E-3B-Instructオープンソース言語モデル - エッジデバイスに適し、推論能力が強くメモリ使用量が低い

ホーム

Falcon E 3B Instruct

tiiuaeによって開発

Falcon-E-3B-Instructは1.58ビットアーキテクチャに基づく高効率な言語モデルで、エッジデバイス向けに最適化されており、優れた推論能力と低メモリ消費を特徴とします。

大規模言語モデル

Transformers

オープンソースライセンス:その他 #1.58ビット量子化 #エッジコンピューティング最適化 #英語命令ファインチューニング

ダウンロード数 225

リリース時間 : 4/16/2025

モデル概要

このモデルは純粋なTransformerアーキテクチャの1.58ビットバージョンを採用し、英語をサポート、様々な自然言語処理タスクに適しており、特にリソースが制限された環境での展開に最適です。

モデル特徴

高効率1.58ビットアーキテクチャ

革新的な1.58ビット量子化技術を採用し、メモリ消費を大幅に削減しながらモデル性能を維持

エッジデバイス最適化

エッジコンピューティングシナリオ向けに設計され、955MBの超低メモリ消費でリソース制約環境に適応

マルチバージョンサポート

BitNetモデル、事前量子化チェックポイント、bfloat16バージョンを提供し、様々な使用シナリオのニーズに対応

モデル能力

テキスト生成

命令追従

質問応答システム

コンテンツ作成

使用事例

スマートアシスタント

対話システム

エッジデバイスに展開可能なインテリジェント対話アシスタント

IFEVAL評価で60.97点を獲得

教育

学習支援

学生向けリアルタイム学習支援と問題解答を提供

数学難問評価で15.3点を獲得

🚀 トランスフォーマー

このライブラリは、BitNetやFalcon - Eなどの技術を用いた自然言語処理モデルを提供します。Falcon - Eシリーズのモデルは、低メモリ使用量で高い性能を発揮し、推論やファインチューニングに便利です。

🚀 クイックスタート

このモデルを使用するには、Hugging FaceのtransformersライブラリまたはBitNetライブラリを利用できます。目的に応じて、モデルとのやり取り方法は複数あります。

✨ 主な機能

低メモリ使用量：Falcon - Eシリーズのモデルは、少ないメモリで高い性能を発揮します。
複数のバリアント：各Falcon - Eシリーズモデルには、BitNetモデル、ファインチューニング用の事前量子化チェックポイント、bfloat16バージョンのBitNetモデルの3つのバリアントがあります。

📦 インストール

BitNetを使用する場合

git clone https://github.com/microsoft/BitNet && cd BitNet
pip install -r requirements.txt
python setup_env.py --hf-repo tiiuae/Falcon-E-3B-Instruct -q i2_s

💻 使用例

基本的な使用法

transformersを使用した推論

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-E-3B-Instruct"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
).to("cuda")

# Perform text generation

BitNetを使用した推論

python run_inference.py -m models/Falcon-E-3B-Instruct/ggml-model-i2_s.gguf -p "You are a helpful assistant" -cnv

高度な使用法

ファインチューニング

import torch

from transformers import AutoModelForCausalLM, AutoTokenizer
from trl import SFTTrainer
from onebitllms import replace_linear_with_bitnet_linear, quantize_to_1bit

model_id = "tiiuae/Falcon-E-3B-Instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id, revision="prequantized")
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    revision="prequantized"
)
model = replace_linear_with_bitnet_linear(model)

trainer = SFTTrainer(
    model,
    ...
)

trainer.train()

quantize_to_1bit(output_directory)

📚 ドキュメント

モデル詳細

属性	详情
開発元	https://www.tii.ae
モデルタイプ	因果的デコーダーのみ / ベースバージョン
アーキテクチャ	純粋なトランスフォーマー - 1.58bitバージョン
言語	英語
ライセンス	Falcon - LLM License

学習詳細

このモデルの学習プロトコルの詳細については、Falcon - E技術ブログ記事を参照してください。

評価

評価結果は、以前のHugging Faceリーダーボードv2タスクからの正規化されたスコアです。

1Bスケール以下のモデル

モデル	パラメータ数	メモリ使用量	IFEVAL	Math - Hard	GPQA	MuSR	BBH	MMLU - Pro	平均
Qwen - 2.5 - 0.5B	0.5B	1GB	16.27	3.93	0.0	2.08	6.95	10.06	6.55
SmolLM2 - 360M	0.36B	720MB	21.15	1.21	0.0	7.73	5.54	1.88	6.25
Qwen - 2.5 - 1.5B	1.5B	3.1GB	26.74	9.14	16.66	5.27	20.61	4.7	13.85
Llama - 3.2 - 1B	1.24B	2.47GB	14.78	1.21	4.37	2.56	2.26	0	4.2
SmolLM2 - 1.7B	1.7B	3.4GB	24.4	2.64	9.3	4.6	12.64	3.91	9.58
Falcon - 3 - 1B - Base	1.5B	3GB	24.28	3.32	11.34	9.71	6.76	3.91	9.89
Hymba - 1.5B - Base	1.5B	3GB	22.95	1.36	7.69	5.18	10.25	0.78	8.04
Falcon - E - 1B - Base	1.8B	635MB	32.9	10.97	2.8	3.65	12.28	17.82	13.40

3Bスケールのモデル

モデル	パラメータ数	メモリ使用量	IFEVAL	Math - Hard	GPQA	MuSR	BBH	MMLU - Pro	平均
Falcon - 3 - 3B - Base	3B	6.46GB	15.74	11.78	21.58	6.27	18.09	6.26	15.74
Qwen2.5 - 3B	3B	6.17GB	26.9	14.8	24.3	11.76	24.48	6.38	18.1
Falcon - E - 3B - Base	3B	955MB	36.67	13.45	8.67	4.14	19.83	27.16	18.32

以下は、命令によるファインチューニングを行ったモデルの結果です。

1Bスケール以下のモデル

モデル	パラメータ数	メモリ使用量	IFEVAL	Math - Hard	GPQA	MuSR	BBH	MMLU - Pro	平均
Qwen - 2.5 - 0.5B - Instruct	500M	1GB	30.71	0	8.43	0.94	7.75	0	6.59
SmolLM2 - 360M - Instruct	360M	720MB	38.42	1.51	4.17	2.77	1.3	0.67	8.14
Qwen - 2.5 - 1.5B - Instruct	1.5B	3.1GB	44.76	22.05	19.81	3.19	19.99	0.78	18.43
SmolLM2 - 1.7B	1.7B	3.4GB	53.68	5.82	10.92	4.1	11.71	0	15.02
Falcon - 3 - 1B - Instruct	1.5B	3GB	55.57	6.34	12.96	10.56	9.32	2.24	16.16
Hymba - 1.5B - Instruct	1.5B	3GB	60.09	2.72	4.59	1.05	11.56	5.515	14.19
Falcon - E - 1B - Instruct	1.8B	635MB	54.35	9.12	16.5	2.51	19.42	9.64	18.59

3Bスケールのモデル

モデル	パラメータ数	メモリ使用量	IFEVAL	Math - Hard	GPQA	MuSR	BBH	MMLU - Pro	平均
Falcon - 3 - 3B - Instruct	3B	6.46GB	69.77	25	26.29	11.13	22.28	5.15	26.6
Qwen2.5 - 3B - Instruct	3B	6.17GB	64.75	36.78	25.8	7.57	25.05	3.02	27.16
Falcon - E - 3B - Instruct	3B	955MB	60.97	15.3	23.59	2.12	26.45	7.45	22.64666667

有用なリンク

リリースブログ記事を確認する。
onebitllmsライブラリについて詳しく学ぶ。
質問がある場合や研究者や開発者と交流したい場合は、ディスコードサーバーに参加してください。

📄 ライセンス

このモデルは、Falcon - LLM Licenseの下で提供されています。

📚 引用

Falcon - Eシリーズのモデルがあなたの研究に役立った場合は、以下のように引用してください。

@misc{tiionebitllms,
    title = {Falcon-E, a series of powerful, universal and fine-tunable 1.58bit language models.},
    author = {Falcon-LLM Team},
    month = {April},
    url = {https://falcon-lm.github.io/blog/falcon-edge},
    year = {2025}
}