Falcon-H1-1.5B-Deep-Base開源語言模型 - 免費支持多語言任務處理

首頁

Falcon H1 1.5B Deep Base

由tiiuae開發

Falcon-H1是由TII開發的高效混合架構語言模型，結合Transformer與Mamba架構，支持多語言任務

大型語言模型

Transformers

支持多種語言開源協議:其他 #混合架構推理 #多語言生成 #高效小模型

下載量 194

發布時間 : 5/1/2025

模型概述

因果僅解碼器架構的混合Transformer+Mamba模型，專注於高效推理和多語言處理能力

模型特點

混合架構創新

結合Transformer的注意力機制與Mamba架構的高效序列建模能力

多語言支持

原生支持18種語言處理，包括東亞和阿拉伯語系

高效推理

在1B參數級別實現超越同類模型的推理效率

模型能力

多語言文本生成

複雜推理任務處理

編程代碼生成

數學問題求解

科學知識問答

使用案例

教育

多語言學習助手

支持18種語言的互動式學習

在MMLU多語言理解基準中表現優異

研發

科研輔助

處理STEM領域複雜問題

在MMLU-Pro科學基準測試中達41.07分

🚀 Falcon-H1模型

Falcon-H1是一款由tiiuae開發的語言模型，採用混合Transformer與Mamba架構，支持英語及多語言。它在多種任務上表現出色，用戶可通過Hugging Face transformers、vLLM或自定義的llama.cpp庫使用該模型。

🚀 快速開始

目前，若要使用此模型，你可以藉助Hugging Face的transformers、vLLM庫，或者我們自定義的llama.cpp庫的分支。

推理

確保安裝transformers或vLLM的最新版本，必要時從源代碼安裝這些包：

pip install git+https://github.com/huggingface/transformers.git

更多關於從源代碼構建vLLM的詳細信息，請參考官方vLLM文檔。

🤗 transformers

參考以下代碼片段，使用🤗 transformers運行H1模型：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

vLLM

對於vLLM，只需執行以下命令啟動服務器：

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

`llama.cpp`

我們正在將架構直接集成到llama.cpp庫中，在此期間，你可以安裝我們的庫分支並直接使用：https://github.com/tiiuae/llama.cpp-Falcon-H1，安裝指南與llama.cpp相同。

✨ 主要特性

模型類型：因果解碼器
架構：混合Transformer + Mamba架構
支持語言：英語、多語言
許可證：Falcon-LLM許可證

📦 安裝指南

安裝`transformers`

pip install git+https://github.com/huggingface/transformers.git

安裝`vLLM`

參考官方vLLM文檔從源代碼構建。

📚 詳細文檔

模型詳情

開發者：https://www.tii.ae
模型類型：因果解碼器
架構：混合Transformer + Mamba架構
支持語言：英語、多語言
許可證：Falcon-LLM許可證

訓練詳情

有關此模型訓練協議的更多詳細信息，請參考Falcon-H1技術博客文章。

評估

Falcon-H1系列在各種任務上表現出色，包括推理任務。具體評估結果如下：

任務	Falcon-H1-1.5B-deep	Qwen3-1.7B	Qwen2.5-1.5B	Gemma3-1B	Llama3.2-1B	Falcon3-1B
通用任務
BBH	52.37	43.05	40.55	30.26	30.72	35.24
MMLU	66.29	62.46	61.13	26.33	32.39	45.14
ARC-C	55.89	55.72	54.27	39.33	39.42	47.87
HellaSwag	69.72	67.09	67.86	62.94	65.73	62.3
Winogrande	67.09	66.3	64.56	62.59	62.75	61.17
數學任務
GSM8k	68.69	70.74	63.0	2.2	7.05	34.95
MATH lvl5	24.77	16.39	8.84	1.21	0.98	3.4
科學任務
GPQA	32.8	29.45	28.36	24.66	23.57	27.85
MMLU-Pro	41.07	33.81	28.72	11.31	11.8	16.11
MMLU-stem	67.43	61.53	54.93	27.59	30.19	40.06
代碼任務
HumanEval	52.44	67.68	35.37	6.71	18.9	10.37
HumanEval+	46.34	60.98	29.27	5.49	16.46	9.15
MBPP	70.9	67.72	60.05	12.7	35.98	12.43
MBPP+	60.32	58.99	49.47	9.52	29.89	9.52

更多詳細評估信息可查看發佈博客文章。

引用

如果Falcon-H1系列模型對你的工作有幫助，請引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}