Falcon-H1-1.5B-Deep-Instruct開源AI模型 - 支持英語與多語種任務免費部署

首頁

Falcon H1 1.5B Deep Instruct

由tiiuae開發

獵鷹-H1是由阿聯酋技術創新研究院開發的混合Transformer與曼巴架構的因果解碼器模型，支持英語和多語種任務。

大型語言模型

Transformers

開源協議:其他 #混合Transformer架構 #多語言推理 #高效數學計算

下載量 987

發布時間 : 5/1/2025

模型概述

獵鷹-H1系列模型採用創新的混合架構，結合了Transformer和曼巴架構的優勢，在推理任務中表現卓越。

模型特點

混合架構創新

結合Transformer與曼巴架構的優勢，提升模型性能

多語言支持

支持英語及多種語言處理

高效推理能力

在各類推理任務中表現卓越

模型能力

文本生成

邏輯推理

數學計算

編程代碼生成

指令遵循

科學問題解答

使用案例

教育

數學問題解答

解決各類數學題目

在GSM8k等數學基準測試中表現優異

編程

代碼生成

根據自然語言描述生成代碼

在HumanEval等編程基準測試中表現突出

研究

科學問題解答

回答專業領域的科學問題

在MMLU理工科測試中達到67.3分

🚀 Falcon-H1模型

Falcon-H1是由tii.ae開發的一系列語言模型，採用混合Transformer + Mamba架構，在多種任務中表現出色，為自然語言處理任務提供了高效且強大的解決方案。

🚀 快速開始

目前，要使用此模型，你可以依賴Hugging Face的transformers、vllm或我們自定義的llama.cpp庫的分支。

推理

確保安裝最新版本的transformers或vllm，必要時從源代碼安裝這些包：

pip install git+https://github.com/huggingface/transformers.git

有關從源代碼構建vLLM的更多詳細信息，請參考官方vLLM文檔。

🤗 transformers

參考以下代碼片段，使用🤗 transformers運行H1模型：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

vLLM

對於vLLM，只需執行以下命令啟動服務器：

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

`llama.cpp`

雖然我們正在努力將我們的架構直接集成到llama.cpp庫中，但你可以安裝我們的庫分支並直接使用：https://github.com/tiiuae/llama.cpp-Falcon-H1。使用與llama.cpp相同的安裝指南。

✨ 主要特性

模型類型：因果解碼器
架構：混合Transformer + Mamba架構
支持語言：英語、多語言
許可證：Falcon-LLM許可證

📦 安裝指南

安裝`transformers`

pip install git+https://github.com/huggingface/transformers.git

安裝`vllm`

參考官方vLLM文檔從源代碼構建。

💻 使用示例

基礎用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

📚 詳細文檔

模型詳情

開發者：https://www.tii.ae
模型類型：因果解碼器
架構：混合Transformer + Mamba架構
支持語言：英語、多語言
許可證：Falcon-LLM許可證

訓練詳情

有關此模型訓練協議的更多詳細信息，請參考Falcon-H1技術博客文章。

評估

Falcon-H1系列在各種任務中表現出色，包括推理任務。

任務	Falcon-H1-1.5B-deep	Qwen3-1.7B	Qwen2.5-1.5B	Gemma3-1B	Llama3.2-1B	Falcon3-1B
通用
BBH	54.43	35.18	42.41	35.86	33.21	34.47
ARC-C	43.86	34.81	40.53	34.13	34.64	43.09
TruthfulQA	50.48	49.39	47.05	42.17	42.08	42.31
HellaSwag	65.54	49.27	62.23	42.24	55.3	58.53
MMLU	66.11	57.04	59.76	40.87	45.93	46.1
數學
GSM8k	82.34	69.83	57.47	42.38	44.28	44.05
MATH-500	77.8	73.0	48.4	45.4	13.2	19.8
AMC-23	56.56	46.09	24.06	19.22	7.19	6.87
AIME-24	14.37	12.5	2.29	0.42	1.46	0.41
AIME-25	11.04	8.12	1.25	1.25	0.0	0.21
科學
GPQA	33.22	27.68	26.26	28.19	26.59	26.76
GPQA_Diamond	40.57	33.33	25.59	21.55	25.08	31.31
MMLU-Pro	41.89	23.54	28.35	14.46	16.2	18.49
MMLU-stem	67.3	54.3	54.04	35.39	39.16	39.64
代碼
HumanEval	73.78	67.68	56.1	40.85	34.15	22.56
HumanEval+	68.9	60.96	50.61	37.2	29.88	20.73
MBPP	68.25	58.73	64.81	57.67	33.6	20.63
MBPP+	56.61	49.74	56.08	50.0	29.37	17.2
LiveCodeBench	23.87	14.87	12.52	5.09	2.35	0.78
CRUXEval	52.32	18.88	34.76	12.7	0.06	15.58
指令遵循
IFEval	83.5	70.77	45.33	61.48	55.34	54.26
Alpaca-Eval	27.12	21.89	9.54	17.87	9.38	6.98
MTBench	8.53	7.61	7.1	7.03	6.37	6.03
LiveBench	36.83	40.73	21.65	18.79	14.97	14.1

你可以在我們的發佈博客文章中查看更詳細的基準測試。

有用鏈接

查看我們的發佈博客文章。
如果你有任何問題或想與我們的研究人員和開發人員交流，請隨時加入我們的Discord服務器。

📄 許可證

本模型使用Falcon-LLM許可證，詳情請見https://falconllm.tii.ae/falcon-terms-and-conditions.html。

📚 引用

如果Falcon-H1系列模型對你的工作有幫助，請引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}