Falcon - H1 - 0.5B - Base开源NLP模型 - 聚焦英语任务展现优异性能

首页

Falcon H1 0.5B Base

由 tiiuae 开发

Falcon-H1是由TII开发的混合Transformers + Mamba架构的仅解码因果模型，专注于英语NLP任务，性能优异。

大型语言模型

Transformers

开源协议:其他 #混合架构推理 #高效数学能力 #科学任务优化

下载量 485

发布时间 : 5/1/2025

模型简介

Falcon-H1是一个高效的混合架构语言模型，结合了Transformers和Mamba的优势，适用于各种自然语言处理任务。

模型特点

混合架构

结合Transformers和Mamba架构的优势，提高模型效率和性能。

高效推理

支持多种推理方式，包括transformers、vLLM和定制的llama.cpp分支。

优异性能

在多项基准测试中表现优于同类模型，特别是在数学和科学任务上。

模型能力

文本生成

数学推理

科学问答

代码生成

使用案例

通用NLP

问答系统

用于构建知识问答系统，回答各种领域的问题。

在MMLU和BBH等基准测试中表现优异

数学应用

数学问题求解

解决复杂的数学问题，包括GSM8k和MATH lvl5等任务。

在GSM8k上达到60.2%的准确率

代码生成

编程辅助

生成和补全代码，帮助开发者提高效率。

在HumanEval上达到35.98%的准确率

🚀 Falcon-H1模型

Falcon-H1是一个基于混合架构的语言模型，结合了Transformer和Mamba架构，在多种任务中表现出色，为自然语言处理任务提供了高效且强大的解决方案。

🚀 快速开始

目前，要使用此模型，你可以依赖Hugging Face的transformers、vLLM或我们自定义的llama.cpp库的分支。

✨ 主要特性

先进架构：采用混合Transformer + Mamba架构。
多任务表现出色：在推理等多种任务中表现优异。
多库支持：支持transformers、vLLM和自定义的llama.cpp库。

📦 安装指南

安装`transformers`

确保安装最新版本的transformers，可从源代码安装：

pip install git+https://github.com/huggingface/transformers.git

安装`vLLM`

pip install vllm

安装`llama.cpp`

可安装我们自定义的llama.cpp库的分支：https://github.com/tiiuae/llama.cpp-Falcon-H1 ，安装指南与llama.cpp相同。

💻 使用示例

基础用法

使用`transformers`运行H1模型

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

使用`vLLM`启动服务器

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

📚 详细文档

模型详情

属性	详情
开发方	https://www.tii.ae
模型类型	因果解码器
架构	混合Transformer + Mamba架构
语言	英语
许可证	Falcon-LLM License

训练详情

有关此模型训练协议的更多详细信息，请参考Falcon-H1技术博客文章。

评估

Falcon-H1系列在各种任务中表现出色，包括推理任务。

任务	Falcon-H1-0.5B	Qwen3-0.6B	Qwen2.5-0.5B	Gemma3-1B	Llama3.2-1B	Falcon3-1B
通用
BBH	40.22	36.07	32.62	30.26	30.72	35.24
MMLU	55.04	52.64	47.61	26.33	32.39	45.14
ARC-C	46.93	44.8	35.32	39.33	39.42	47.87
HellaSwag	56.3	53.51	51.79	62.94	65.73	62.3
Winogrande	59.43	60.54	56.83	62.59	62.75	61.17
数学
GSM8k	60.2	50.04	34.8	2.2	7.05	34.95
MATH lvl5	15.18	9.29	4.23	1.21	0.98	3.4
科学
GPQA	29.7	29.11	27.94	24.66	23.57	27.85
MMLU-Pro	30.04	22.99	18.98	11.31	11.8	16.11
MMLU-stem	57.12	50.11	43.74	27.59	30.19	40.06
代码
HumanEval	35.98	31.71	29.27	6.71	18.9	10.37
HumanEval+	31.1	27.44	25.0	5.49	16.46	9.15
MBPP	52.12	51.06	40.74	12.7	35.98	12.43
MBPP+	43.39	42.33	34.66	9.52	29.89	9.52

你可以在我们的发布博客文章中查看更详细的基准测试。

有用链接

查看我们的发布博客文章。
如果你有任何问题或想与我们的研究人员和开发人员交流，请加入我们的Discord服务器。

📄 许可证

本模型使用Falcon-LLM License，详情请见许可证链接。

📚 引用

如果Falcon-H1系列模型对你的工作有帮助，请引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}