Falcon-H1-34B-Instruct-GPTQ-Int8开源语言模型 - 支持多语言任务，免费好用！

首页

Falcon H1 34B Instruct GPTQ Int8

由 tiiuae 开发

猎鹰-H1是由TII开发的高性能混合架构语言模型，结合了Transformers和Mamba架构的优势，支持英语和多语言任务。

大型语言模型

Transformers

开源协议:其他 #混合架构Transformer-Mamba #多语言推理 #高性能数学能力

下载量 105

发布时间 : 5/12/2025

模型简介

猎鹰-H1是一个因果解码器专用的大型语言模型，具有高效的推理能力和优异的性能表现。

模型特点

混合架构

结合Transformers和Mamba架构的优势，提高模型效率和性能

多语言支持

支持英语和多种语言处理任务

高性能推理

在多种基准测试中表现优异，特别是在数学和科学任务上

模型能力

文本生成

指令遵循

代码生成

数学推理

科学问题解答

使用案例

教育

数学问题解答

解答复杂的数学问题

在GSM8k和MATH-500等数学基准测试中表现优异

编程

代码生成

根据自然语言描述生成代码

在HumanEval和MBPP等代码基准测试中表现良好

🚀 Falcon-H1模型

Falcon-H1是一系列由tiiuae开发的语言模型，采用混合Transformer和Mamba架构，在多种任务中表现出色，为自然语言处理提供了高效且强大的解决方案。

🚀 快速开始

目前，要使用此模型，你可以依赖Hugging Face的transformers、vLLM或我们自定义的llama.cpp库分支。

✨ 主要特性

模型类型：因果解码器
架构：混合Transformer + Mamba架构
支持语言：英语、多语言
许可证：Falcon-LLM许可证

📦 安装指南

安装transformers

确保安装最新版本的transformers，可以从源安装：

pip install git+https://github.com/huggingface/transformers.git

安装vLLM

从源构建vLLM的更多详细信息，请参考官方vLLM文档。

💻 使用示例

基础用法

使用transformers运行H1模型

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

使用vLLM启动服务器

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

使用`llama.cpp`

我们正在将架构直接集成到llama.cpp库中，在此之前，你可以安装我们的库分支并直接使用：https://github.com/tiiuae/llama.cpp-Falcon-H1，安装指南与llama.cpp相同。

📚 详细文档

模型详情

开发者：https://www.tii.ae
模型类型：因果解码器
架构：混合Transformer + Mamba架构
支持语言：英语、多语言
许可证：Falcon-LLM许可证

训练详情

有关此模型训练协议的更多详细信息，请参考Falcon-H1技术博客文章。

评估

Falcon-H1系列在各种任务中表现出色，包括推理任务。具体评估结果如下：

任务	Falcon-H1-34B	Qwen3-32B	Qwen2.5-72B	Qwen2.5-32B	Gemma3-27B	Llama3.3-70B	Llama4-scout
通用
BBH	70.68	62.47	72.52	68.72	67.28	69.15	64.9
ARC-C	61.01	48.98	46.59	44.54	54.52	63.65	56.14
TruthfulQA	65.27	58.58	69.8	70.28	64.26	66.15	62.74
HellaSwag	81.94	68.89	68.79	73.95	57.25	70.24	65.03
MMLU	84.05	80.89	84.42	82.8	78.01	82.08	80.4
数学
GSM8k	83.62	88.78	82.26	78.47	90.37	93.71	90.37
MATH-500	83.8	82.0	83.6	82.2	90.0	70.6	83.2
AMC-23	69.38	67.34	67.34	68.75	77.81	39.38	69.06
AIME-24	23.75	27.71	17.29	17.92	27.5	12.92	27.92
AIME-25	16.67	19.79	15.21	11.46	22.71	1.25	8.96
科学
GPQA	41.53	30.2	37.67	34.31	36.49	31.99	31.8
GPQA_Diamond	49.66	49.49	44.95	40.74	47.47	42.09	51.18
MMLU-Pro	58.73	54.68	56.35	56.63	47.81	53.29	55.58
MMLU-stem	83.57	81.64	82.59	82.37	73.55	74.88	75.2
代码
HumanEval	87.2	90.85	87.2	90.24	86.59	83.53	85.4
HumanEval+	81.71	85.37	80.49	82.32	78.05	79.87	78.7
MBPP	83.86	86.24	89.68	87.83	88.36	88.09	81.5
MBPP+	71.43	71.96	75.4	74.07	74.07	73.81	64.8
LiveCodeBench	49.71	45.01	54.6	49.12	39.53	40.31	40.12
CRUXEval	73.07	78.45	75.63	73.5	74.82	69.53	68.32
指令遵循
IFEval	89.37	86.97	86.35	81.79	83.19	89.94	86.32
Alpaca-Eval	48.32	64.21	49.29	39.26	56.16	38.27	36.26
MTBench	9.2	9.05	9.16	9.09	8.75	8.98	8.98
LiveBench	46.26	63.05	54.03	52.92	55.41	53.11	54.21

你可以在我们的发布博客文章中查看更详细的基准测试。

有用链接

查看我们的发布博客文章。
如果你有任何问题或想与我们的研究人员和开发人员交流，请随时加入我们的Discord服务器。

📄 许可证

本模型使用Falcon-LLM许可证，详情请见https://falconllm.tii.ae/falcon-terms-and-conditions.html。

📚 引用

如果Falcon-H1系列模型对你的工作有帮助，请引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}