Falcon - H1 - 0.5B - Base開源NLP模型 - 聚焦英語任務展現優異性能

首頁

Falcon H1 0.5B Base

由tiiuae開發

Falcon-H1是由TII開發的混合Transformers + Mamba架構的僅解碼因果模型，專注於英語NLP任務，性能優異。

大型語言模型

Transformers

開源協議:其他 #混合架構推理 #高效數學能力 #科學任務優化

下載量 485

發布時間 : 5/1/2025

模型概述

Falcon-H1是一個高效的混合架構語言模型，結合了Transformers和Mamba的優勢，適用於各種自然語言處理任務。

模型特點

混合架構

結合Transformers和Mamba架構的優勢，提高模型效率和性能。

高效推理

支持多種推理方式，包括transformers、vLLM和定製的llama.cpp分支。

優異性能

在多項基準測試中表現優於同類模型，特別是在數學和科學任務上。

模型能力

文本生成

數學推理

科學問答

代碼生成

使用案例

通用NLP

問答系統

用於構建知識問答系統，回答各種領域的問題。

在MMLU和BBH等基準測試中表現優異

數學應用

數學問題求解

解決複雜的數學問題，包括GSM8k和MATH lvl5等任務。

在GSM8k上達到60.2%的準確率

代碼生成

編程輔助

生成和補全代碼，幫助開發者提高效率。

在HumanEval上達到35.98%的準確率

🚀 Falcon-H1模型

Falcon-H1是一個基於混合架構的語言模型，結合了Transformer和Mamba架構，在多種任務中表現出色，為自然語言處理任務提供了高效且強大的解決方案。

🚀 快速開始

目前，要使用此模型，你可以依賴Hugging Face的transformers、vLLM或我們自定義的llama.cpp庫的分支。

✨ 主要特性

先進架構：採用混合Transformer + Mamba架構。
多任務表現出色：在推理等多種任務中表現優異。
多庫支持：支持transformers、vLLM和自定義的llama.cpp庫。

📦 安裝指南

安裝`transformers`

確保安裝最新版本的transformers，可從源代碼安裝：

pip install git+https://github.com/huggingface/transformers.git

安裝`vLLM`

pip install vllm

安裝`llama.cpp`

可安裝我們自定義的llama.cpp庫的分支：https://github.com/tiiuae/llama.cpp-Falcon-H1 ，安裝指南與llama.cpp相同。

💻 使用示例

基礎用法

使用`transformers`運行H1模型

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

使用`vLLM`啟動服務器

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

📚 詳細文檔

模型詳情

屬性	詳情
開發方	https://www.tii.ae
模型類型	因果解碼器
架構	混合Transformer + Mamba架構
語言	英語
許可證	Falcon-LLM License

訓練詳情

有關此模型訓練協議的更多詳細信息，請參考Falcon-H1技術博客文章。

評估

Falcon-H1系列在各種任務中表現出色，包括推理任務。

任務	Falcon-H1-0.5B	Qwen3-0.6B	Qwen2.5-0.5B	Gemma3-1B	Llama3.2-1B	Falcon3-1B
通用
BBH	40.22	36.07	32.62	30.26	30.72	35.24
MMLU	55.04	52.64	47.61	26.33	32.39	45.14
ARC-C	46.93	44.8	35.32	39.33	39.42	47.87
HellaSwag	56.3	53.51	51.79	62.94	65.73	62.3
Winogrande	59.43	60.54	56.83	62.59	62.75	61.17
數學
GSM8k	60.2	50.04	34.8	2.2	7.05	34.95
MATH lvl5	15.18	9.29	4.23	1.21	0.98	3.4
科學
GPQA	29.7	29.11	27.94	24.66	23.57	27.85
MMLU-Pro	30.04	22.99	18.98	11.31	11.8	16.11
MMLU-stem	57.12	50.11	43.74	27.59	30.19	40.06
代碼
HumanEval	35.98	31.71	29.27	6.71	18.9	10.37
HumanEval+	31.1	27.44	25.0	5.49	16.46	9.15
MBPP	52.12	51.06	40.74	12.7	35.98	12.43
MBPP+	43.39	42.33	34.66	9.52	29.89	9.52

你可以在我們的發佈博客文章中查看更詳細的基準測試。

有用鏈接

查看我們的發佈博客文章。
如果你有任何問題或想與我們的研究人員和開發人員交流，請加入我們的Discord服務器。

📄 許可證

本模型使用Falcon-LLM License，詳情請見許可證鏈接。

📚 引用

如果Falcon-H1系列模型對你的工作有幫助，請引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}