Falcon-E-3B-Instruct開源語言模型 - 邊緣設備適用，推理強且內存佔用低

Home

Falcon E 3B Instruct

Developed by tiiuae

Falcon-E-3B-Instruct 是一個基於1.58比特架構的高效語言模型，專為邊緣設備優化，具有出色的推理能力和低內存佔用。

大型語言模型

Transformers

Open Source License:Other #1.58比特量化 #邊緣計算優化 #英語指令微調

Downloads 225

Release Time : 4/16/2025

Model Overview

該模型採用純Transformer架構的1.58比特版本，支持英語，適用於各種自然語言處理任務，特別適合資源受限環境下的部署。

Model Features

高效1.58比特架構

採用創新的1.58比特量化技術，大幅降低內存佔用同時保持模型性能

邊緣設備優化

專為邊緣計算場景設計，955MB的超低內存佔用使其適合資源受限環境

多版本支持

提供BitNet模型、預量化檢查點和bfloat16版本，滿足不同使用場景需求

Model Capabilities

文本生成

指令跟隨

問答系統

內容創作

Use Cases

智能助手

對話系統

部署在邊緣設備上的智能對話助手

在IFEVAL評估中獲得60.97分

教育

學習輔導

為學生提供即時學習輔導和問題解答

在數學難題評估中獲得15.3分

🚀 Transformers庫 - Falcon-E模型

本項目提供了基於transformers庫的Falcon-E模型，這是一系列強大、通用且可微調的1.58bit語言模型，具有低內存佔用和良好的性能表現，可用於文本生成等自然語言處理任務。

🚀 快速開始

目前，要使用此模型，你可以依賴Hugging Face的transformers庫或BitNet庫。根據你的目標用途，有多種方式可以與模型進行交互。對於每個Falcon-E系列模型，你有三種變體：BitNet模型、用於微調的預量化檢查點以及BitNet模型的bfloat16版本。

✨ 主要特性

低內存佔用：在不同規模的模型中，Falcon-E系列模型相較於其他模型具有更低的內存佔用，如Falcon-E-1B-Base僅需635MB，Falcon-E-3B-Base僅需955MB。
性能良好：在多個評估指標上表現出色，如在IFEVAL、Math-Hard等任務中取得了較好的成績。
可微調：支持使用onebitllms Python包進行微調。

📦 安裝指南

若使用transformers庫，可通過以下命令安裝：

pip install transformers

若使用BitNet庫，可通過以下命令安裝：

git clone https://github.com/microsoft/BitNet && cd BitNet
pip install -r requirements.txt

💻 使用示例

基礎用法

使用`transformers`庫進行推理（BitNet檢查點）

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-E-3B-Instruct"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
).to("cuda")

# Perform text generation

使用`transformers`庫進行推理（經典`bfloat16`版本）

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-E-3B-Instruct"
revision = "bfloat16"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  revision=revision,
).to("cuda")

# Perform text generation

使用BitNet庫進行推理

python setup_env.py --hf-repo tiiuae/Falcon-E-3B-Instruct -q i2_s
python run_inference.py -m models/Falcon-E-3B-Instruct/ggml-model-i2_s.gguf -p "You are a helpful assistant" -cnv

高級用法

模型微調

import torch

from transformers import AutoModelForCausalLM, AutoTokenizer
from trl import SFTTrainer
from onebitllms import replace_linear_with_bitnet_linear, quantize_to_1bit

model_id = "tiiuae/Falcon-E-3B-Instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id, revision="prequantized")
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    revision="prequantized"
)
model = replace_linear_with_bitnet_linear(model)

trainer = SFTTrainer(
    model,
    ...
)

trainer.train()

quantize_to_1bit(output_directory)

📚 詳細文檔

模型詳情

屬性	詳情
模型類型	因果解碼器-only / 基礎版本
架構	純Transformer - 1.58bit版本
語言	英語
許可證	Falcon-LLM許可證
開發者	https://www.tii.ae

訓練詳情

有關此模型訓練協議的更多詳細信息，請參考Falcon-E技術博客文章。

評估結果

我們在以下表格中報告了內部管道基準測試結果：

注意：評估結果是來自前Hugging Face排行榜v2任務的歸一化分數

1B規模及以下模型

模型	參數數量	內存佔用	IFEVAL	Math-Hard	GPQA	MuSR	BBH	MMLU-Pro	平均
Qwen-2.5-0.5B	0.5B	1GB	16.27	3.93	0.0	2.08	6.95	10.06	6.55
SmolLM2-360M	0.36B	720MB	21.15	1.21	0.0	7.73	5.54	1.88	6.25
Qwen-2.5-1.5B	1.5B	3.1GB	26.74	9.14	16.66	5.27	20.61	4.7	13.85
Llama-3.2-1B	1.24B	2.47GB	14.78	1.21	4.37	2.56	2.26	0	4.2
SmolLM2-1.7B	1.7B	3.4GB	24.4	2.64	9.3	4.6	12.64	3.91	9.58
Falcon-3-1B-Base	1.5B	3GB	24.28	3.32	11.34	9.71	6.76	3.91	9.89
Hymba-1.5B-Base	1.5B	3GB	22.95	1.36	7.69	5.18	10.25	0.78	8.04
Falcon-E-1B-Base	1.8B	635MB	32.9	10.97	2.8	3.65	12.28	17.82	13.40

3B規模模型

模型	參數數量	內存佔用	IFEVAL	Math-Hard	GPQA	MuSR	BBH	MMLU-Pro	平均
Falcon-3-3B-Base	3B	6.46GB	15.74	11.78	21.58	6.27	18.09	6.26	15.74
Qwen2.5-3B	3B	6.17GB	26.9	14.8	24.3	11.76	24.48	6.38	18.1
Falcon-E-3B-Base	3B	955MB	36.67	13.45	8.67	4.14	19.83	27.16	18.32

指令微調模型 - 1B規模及以下

模型	參數數量	內存佔用	IFEVAL	Math-Hard	GPQA	MuSR	BBH	MMLU-Pro	平均
Qwen-2.5-0.5B-Instruct	500M	1GB	30.71	0	8.43	0.94	7.75	0	6.59
SmolLM2-360M-Instruct	360M	720MB	38.42	1.51	4.17	2.77	1.3	0.67	8.14
Qwen-2.5-1.5B-Instruct	1.5B	3.1GB	44.76	22.05	19.81	3.19	19.99	0.78	18.43
SmolLM2-1.7B	1.7B	3.4GB	53.68	5.82	10.92	4.1	11.71	0	15.02
Falcon-3-1B-Instruct	1.5B	3GB	55.57	6.34	12.96	10.56	9.32	2.24	16.16
Hymba-1.5B-Instruct	1.5B	3GB	60.09	2.72	4.59	1.05	11.56	5.515	14.19
Falcon-E-1B-Instruct	1.8B	635MB	54.35	9.12	16.5	2.51	19.42	9.64	18.59

指令微調模型 - 3B規模

模型	參數數量	內存佔用	IFEVAL	Math-Hard	GPQA	MuSR	BBH	MMLU-Pro	平均
Falcon-3-3B-Instruct	3B	6.46GB	69.77	25	26.29	11.13	22.28	5.15	26.6
Qwen2.5-3B-Instruct	3B	6.17GB	64.75	36.78	25.8	7.57	25.05	3.02	27.16
Falcon-E-3B-Instruct	3B	955MB	60.97	15.3	23.59	2.12	26.45	7.45	22.64666667

有用鏈接

查看我們的發佈博客文章。
瞭解更多關於onebitllms庫的信息。
如果你有任何問題或想與我們的研究人員和開發人員交流，請加入我們的Discord服務器。

📄 許可證

本模型使用Falcon-LLM許可證，詳情請見許可證鏈接。

📚 引用

如果Falcon-E系列模型對你的工作有幫助，請引用：

@misc{tiionebitllms,
    title = {Falcon-E, a series of powerful, universal and fine-tunable 1.58bit language models.},
    author = {Falcon-LLM Team},
    month = {April},
    url = {https://falcon-lm.github.io/blog/falcon-edge},
    year = {2025}
}