Falcon-H1-34B-Instruct-GPTQ-Int8開源語言模型 - 支持多語言任務，免費好用！

首頁

Falcon H1 34B Instruct GPTQ Int8

由tiiuae開發

獵鷹-H1是由TII開發的高性能混合架構語言模型，結合了Transformers和Mamba架構的優勢，支持英語和多語言任務。

大型語言模型

Transformers

開源協議:其他 #混合架構Transformer-Mamba #多語言推理 #高性能數學能力

下載量 105

發布時間 : 5/12/2025

模型概述

獵鷹-H1是一個因果解碼器專用的大型語言模型，具有高效的推理能力和優異的性能表現。

模型特點

混合架構

結合Transformers和Mamba架構的優勢，提高模型效率和性能

多語言支持

支持英語和多種語言處理任務

高性能推理

在多種基準測試中表現優異，特別是在數學和科學任務上

模型能力

文本生成

指令遵循

代碼生成

數學推理

科學問題解答

使用案例

教育

數學問題解答

解答覆雜的數學問題

在GSM8k和MATH-500等數學基準測試中表現優異

編程

代碼生成

根據自然語言描述生成代碼

在HumanEval和MBPP等代碼基準測試中表現良好

🚀 Falcon-H1模型

Falcon-H1是一系列由tiiuae開發的語言模型，採用混合Transformer和Mamba架構，在多種任務中表現出色，為自然語言處理提供了高效且強大的解決方案。

🚀 快速開始

目前，要使用此模型，你可以依賴Hugging Face的transformers、vLLM或我們自定義的llama.cpp庫分支。

✨ 主要特性

模型類型：因果解碼器
架構：混合Transformer + Mamba架構
支持語言：英語、多語言
許可證：Falcon-LLM許可證

📦 安裝指南

安裝transformers

確保安裝最新版本的transformers，可以從源安裝：

pip install git+https://github.com/huggingface/transformers.git

安裝vLLM

從源構建vLLM的更多詳細信息，請參考官方vLLM文檔。

💻 使用示例

基礎用法

使用transformers運行H1模型

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

使用vLLM啟動服務器

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

使用`llama.cpp`

我們正在將架構直接集成到llama.cpp庫中，在此之前，你可以安裝我們的庫分支並直接使用：https://github.com/tiiuae/llama.cpp-Falcon-H1，安裝指南與llama.cpp相同。

📚 詳細文檔

模型詳情

開發者：https://www.tii.ae
模型類型：因果解碼器
架構：混合Transformer + Mamba架構
支持語言：英語、多語言
許可證：Falcon-LLM許可證

訓練詳情

有關此模型訓練協議的更多詳細信息，請參考Falcon-H1技術博客文章。

評估

Falcon-H1系列在各種任務中表現出色，包括推理任務。具體評估結果如下：

任務	Falcon-H1-34B	Qwen3-32B	Qwen2.5-72B	Qwen2.5-32B	Gemma3-27B	Llama3.3-70B	Llama4-scout
通用
BBH	70.68	62.47	72.52	68.72	67.28	69.15	64.9
ARC-C	61.01	48.98	46.59	44.54	54.52	63.65	56.14
TruthfulQA	65.27	58.58	69.8	70.28	64.26	66.15	62.74
HellaSwag	81.94	68.89	68.79	73.95	57.25	70.24	65.03
MMLU	84.05	80.89	84.42	82.8	78.01	82.08	80.4
數學
GSM8k	83.62	88.78	82.26	78.47	90.37	93.71	90.37
MATH-500	83.8	82.0	83.6	82.2	90.0	70.6	83.2
AMC-23	69.38	67.34	67.34	68.75	77.81	39.38	69.06
AIME-24	23.75	27.71	17.29	17.92	27.5	12.92	27.92
AIME-25	16.67	19.79	15.21	11.46	22.71	1.25	8.96
科學
GPQA	41.53	30.2	37.67	34.31	36.49	31.99	31.8
GPQA_Diamond	49.66	49.49	44.95	40.74	47.47	42.09	51.18
MMLU-Pro	58.73	54.68	56.35	56.63	47.81	53.29	55.58
MMLU-stem	83.57	81.64	82.59	82.37	73.55	74.88	75.2
代碼
HumanEval	87.2	90.85	87.2	90.24	86.59	83.53	85.4
HumanEval+	81.71	85.37	80.49	82.32	78.05	79.87	78.7
MBPP	83.86	86.24	89.68	87.83	88.36	88.09	81.5
MBPP+	71.43	71.96	75.4	74.07	74.07	73.81	64.8
LiveCodeBench	49.71	45.01	54.6	49.12	39.53	40.31	40.12
CRUXEval	73.07	78.45	75.63	73.5	74.82	69.53	68.32
指令遵循
IFEval	89.37	86.97	86.35	81.79	83.19	89.94	86.32
Alpaca-Eval	48.32	64.21	49.29	39.26	56.16	38.27	36.26
MTBench	9.2	9.05	9.16	9.09	8.75	8.98	8.98
LiveBench	46.26	63.05	54.03	52.92	55.41	53.11	54.21

你可以在我們的發佈博客文章中查看更詳細的基準測試。

有用鏈接

查看我們的發佈博客文章。
如果你有任何問題或想與我們的研究人員和開發人員交流，請隨時加入我們的Discord服務器。

📄 許可證

本模型使用Falcon-LLM許可證，詳情請見https://falconllm.tii.ae/falcon-terms-and-conditions.html。

📚 引用

如果Falcon-H1系列模型對你的工作有幫助，請引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}