Falcon-H1-1.5B-Deep-Instruct开源AI模型 - 支持英语与多语种任务免费部署

首页

Falcon H1 1.5B Deep Instruct

由 tiiuae 开发

猎鹰-H1是由阿联酋技术创新研究院开发的混合Transformer与曼巴架构的因果解码器模型，支持英语和多语种任务。

大型语言模型

Transformers

开源协议:其他 #混合Transformer架构 #多语言推理 #高效数学计算

下载量 987

发布时间 : 5/1/2025

模型简介

猎鹰-H1系列模型采用创新的混合架构，结合了Transformer和曼巴架构的优势，在推理任务中表现卓越。

模型特点

混合架构创新

结合Transformer与曼巴架构的优势，提升模型性能

多语言支持

支持英语及多种语言处理

高效推理能力

在各类推理任务中表现卓越

模型能力

文本生成

逻辑推理

数学计算

编程代码生成

指令遵循

科学问题解答

使用案例

教育

数学问题解答

解决各类数学题目

在GSM8k等数学基准测试中表现优异

编程

代码生成

根据自然语言描述生成代码

在HumanEval等编程基准测试中表现突出

研究

科学问题解答

回答专业领域的科学问题

在MMLU理工科测试中达到67.3分

🚀 Falcon-H1模型

Falcon-H1是由tii.ae开发的一系列语言模型，采用混合Transformer + Mamba架构，在多种任务中表现出色，为自然语言处理任务提供了高效且强大的解决方案。

🚀 快速开始

目前，要使用此模型，你可以依赖Hugging Face的transformers、vllm或我们自定义的llama.cpp库的分支。

推理

确保安装最新版本的transformers或vllm，必要时从源代码安装这些包：

pip install git+https://github.com/huggingface/transformers.git

有关从源代码构建vLLM的更多详细信息，请参考官方vLLM文档。

🤗 transformers

参考以下代码片段，使用🤗 transformers运行H1模型：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

vLLM

对于vLLM，只需执行以下命令启动服务器：

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

`llama.cpp`

虽然我们正在努力将我们的架构直接集成到llama.cpp库中，但你可以安装我们的库分支并直接使用：https://github.com/tiiuae/llama.cpp-Falcon-H1。使用与llama.cpp相同的安装指南。

✨ 主要特性

模型类型：因果解码器
架构：混合Transformer + Mamba架构
支持语言：英语、多语言
许可证：Falcon-LLM许可证

📦 安装指南

安装`transformers`

pip install git+https://github.com/huggingface/transformers.git

安装`vllm`

参考官方vLLM文档从源代码构建。

💻 使用示例

基础用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

📚 详细文档

模型详情

开发者：https://www.tii.ae
模型类型：因果解码器
架构：混合Transformer + Mamba架构
支持语言：英语、多语言
许可证：Falcon-LLM许可证

训练详情

有关此模型训练协议的更多详细信息，请参考Falcon-H1技术博客文章。

评估

Falcon-H1系列在各种任务中表现出色，包括推理任务。

任务	Falcon-H1-1.5B-deep	Qwen3-1.7B	Qwen2.5-1.5B	Gemma3-1B	Llama3.2-1B	Falcon3-1B
通用
BBH	54.43	35.18	42.41	35.86	33.21	34.47
ARC-C	43.86	34.81	40.53	34.13	34.64	43.09
TruthfulQA	50.48	49.39	47.05	42.17	42.08	42.31
HellaSwag	65.54	49.27	62.23	42.24	55.3	58.53
MMLU	66.11	57.04	59.76	40.87	45.93	46.1
数学
GSM8k	82.34	69.83	57.47	42.38	44.28	44.05
MATH-500	77.8	73.0	48.4	45.4	13.2	19.8
AMC-23	56.56	46.09	24.06	19.22	7.19	6.87
AIME-24	14.37	12.5	2.29	0.42	1.46	0.41
AIME-25	11.04	8.12	1.25	1.25	0.0	0.21
科学
GPQA	33.22	27.68	26.26	28.19	26.59	26.76
GPQA_Diamond	40.57	33.33	25.59	21.55	25.08	31.31
MMLU-Pro	41.89	23.54	28.35	14.46	16.2	18.49
MMLU-stem	67.3	54.3	54.04	35.39	39.16	39.64
代码
HumanEval	73.78	67.68	56.1	40.85	34.15	22.56
HumanEval+	68.9	60.96	50.61	37.2	29.88	20.73
MBPP	68.25	58.73	64.81	57.67	33.6	20.63
MBPP+	56.61	49.74	56.08	50.0	29.37	17.2
LiveCodeBench	23.87	14.87	12.52	5.09	2.35	0.78
CRUXEval	52.32	18.88	34.76	12.7	0.06	15.58
指令遵循
IFEval	83.5	70.77	45.33	61.48	55.34	54.26
Alpaca-Eval	27.12	21.89	9.54	17.87	9.38	6.98
MTBench	8.53	7.61	7.1	7.03	6.37	6.03
LiveBench	36.83	40.73	21.65	18.79	14.97	14.1

你可以在我们的发布博客文章中查看更详细的基准测试。

有用链接

查看我们的发布博客文章。
如果你有任何问题或想与我们的研究人员和开发人员交流，请随时加入我们的Discord服务器。

📄 许可证

本模型使用Falcon-LLM许可证，详情请见https://falconllm.tii.ae/falcon-terms-and-conditions.html。

📚 引用

如果Falcon-H1系列模型对你的工作有帮助，请引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}