Falcon-H1-0.5B-Instruct开源语言模型 - 支持英语对话，性能卓越免费可用

首页

Falcon H1 0.5B Instruct

由 tiiuae 开发

猎鹰-H1是由TII开发的混合Transformers+Mamba架构的因果解码器专用语言模型，支持英语，性能卓越。

大型语言模型

Transformers

开源协议:其他 #混合架构推理 #数学能力强化 #编程任务优化

下载量 492

发布时间 : 5/1/2025

模型简介

猎鹰-H1系列模型采用创新的混合架构，结合了Transformers和Mamba的优势，在推理、数学、科学和编程等任务中表现出色。

模型特点

混合架构创新

结合Transformers和Mamba架构优势，实现高效推理

卓越性能

在BBH、GSM8k等多项基准测试中超越同类模型

多领域能力

在数学、科学、编程等多个领域展现强大能力

模型能力

文本生成

数学推理

科学问题解答

代码生成

指令跟随

使用案例

教育

数学问题解答

帮助学生解决复杂的数学问题

在GSM8k测试中达到68.39分

编程辅助

代码生成

根据自然语言描述生成代码

在HumanEval测试中达到51.83分

🚀 transformers

transformers 是一个强大的库，支持使用Falcon-H1系列模型进行推理，在多种任务上表现出色，为自然语言处理提供了高效的解决方案。

🚀 快速开始

目前，要使用此模型，你可以依赖Hugging Face的 transformers、vLLM 或我们自定义的 llama.cpp 库的分支。

✨ 主要特性

模型类型：因果解码器
架构：混合Transformer + Mamba架构
语言：英文
许可证：Falcon-LLM许可证

📦 安装指南

确保安装最新版本的 transformers 或 vLLM，必要时从源代码安装这些包：

pip install git+https://github.com/huggingface/transformers.git

更多关于从源代码构建 vLLM 的详细信息，请参考官方vLLM文档。

💻 使用示例

基础用法

使用 `transformers` 运行H1模型

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

使用 `vLLM`

对于 vLLM，只需执行以下命令启动服务器：

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

使用 `llama.cpp`

在我们将架构直接集成到 llama.cpp 库的同时，你可以安装我们的库分支并直接使用：https://github.com/tiiuae/llama.cpp-Falcon-H1，使用与 llama.cpp 相同的安装指南。

📚 详细文档

模型详情

开发者：https://www.tii.ae
模型类型：因果解码器
架构：混合Transformer + Mamba架构
语言：英文
许可证：Falcon-LLM许可证

训练详情

有关此模型训练协议的更多详细信息，请参考 Falcon-H1技术博客文章。

评估

Falcon-H1系列在各种任务上表现出色，包括推理任务。

任务	Falcon-H1-0.5B	Qwen3-0.6B	Qwen2.5-0.5B	Gemma3-1B	Llama3.2-1B	Falcon3-1B
通用
BBH	42.91	32.95	33.26	35.86	33.21	34.47
ARC-C	37.8	31.06	33.28	34.13	34.64	43.09
TruthfulQA	44.12	51.65	46.19	42.17	42.08	42.31
HellaSwag	51.93	42.17	52.38	42.24	55.3	58.53
MMLU	53.4	42.98	46.07	40.87	45.93	46.1
数学
GSM8k	68.39	42.61	38.51	42.38	44.28	44.05
MATH-500	58.4	46.0	27.8	45.4	13.2	19.8
AMC-23	33.13	27.97	12.5	19.22	7.19	6.87
AIME-24	3.75	2.71	0.62	0.42	1.46	0.41
AIME-25	4.38	1.67	0.21	1.25	0.0	0.21
科学
GPQA	29.95	26.09	26.85	28.19	26.59	26.76
GPQA_Diamond	27.95	25.08	24.24	21.55	25.08	31.31
MMLU-Pro	31.03	16.95	18.73	14.46	16.2	18.49
MMLU-stem	54.55	39.3	39.83	35.39	39.16	39.64
代码
HumanEval	51.83	41.46	36.59	40.85	34.15	22.56
HumanEval+	45.12	37.19	32.32	37.2	29.88	20.73
MBPP	42.59	56.08	46.83	57.67	33.6	20.63
MBPP+	33.07	47.08	39.68	50.0	29.37	17.2
LiveCodeBench	7.05	9.78	2.94	5.09	2.35	0.78
CRUXEval	25.75	23.63	14.88	12.7	0.06	15.58
指令遵循
IFEval	72.07	62.16	32.11	61.48	55.34	54.26
Alpaca-Eval	10.79	9.59	3.26	17.87	9.38	6.98
MTBench	7.06	5.75	4.71	7.03	6.37	6.03
LiveBench	20.8	27.78	14.27	18.79	14.97	14.1

你可以在我们的发布博客文章中查看更详细的基准测试。

有用链接

查看我们的发布博客文章。
如果你有任何问题或想与我们的研究人员和开发人员交流，请随时加入我们的Discord服务器。

📄 许可证

此模型使用 Falcon-LLM许可证。

📚 引用

如果Falcon-H1系列模型对你的工作有帮助，请随意引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}