Falcon-H1-34B-Instructオープンソース言語モデル - デュアルアーキテクチャの利点を融合し、多言語タスクをサポート

ホーム

Falcon H1 34B Instruct

tiiuaeによって開発

Falcon-H1はTIIが開発した効率的なハイブリッドアーキテクチャ言語モデルで、TransformersとMambaアーキテクチャの利点を組み合わせ、英語と多言語タスクをサポートします。

大規模言語モデル

Transformers

オープンソースライセンス:その他 #ハイブリッドアーキテクチャTransformers-Mamba #多言語大規模モデル #効率的な推論最適化

ダウンロード数 2,454

リリース時間 : 5/1/2025

モデル概要

Falcon-H1は因果デコーダ専用の大規模言語モデルで、TransformersとMambaのハイブリッドアーキテクチャを採用し、様々な自然言語処理タスクに適しています。

モデル特徴

ハイブリッドアーキテクチャ

TransformersとMambaアーキテクチャの利点を組み合わせ、モデルの効率と性能を向上させます。

多言語サポート

英語と多言語タスク処理をサポートします。

高性能推論

様々なベンチマークテストで優れた性能を発揮し、特に推論タスクで顕著です。

モデル能力

テキスト生成

言語理解

コード生成

数学的推論

科学問題解答

指示追従

使用事例

汎用NLP

テキスト生成

一貫性があり文脈に沿ったテキストコンテンツを生成します。

HellaSwagなどのベンチマークテストで優れた結果を示しています。

数学と科学

数学問題解答

複雑な数学問題を解決します。

GSM8k、MATH-500などの数学ベンチマークテストで良好な結果を示しています。

コード生成

プログラミング支援

コードスニペットを生成および補完します。

HumanEval、MBPPなどのコードベンチマークテストで優れた結果を示しています。

🚀 transformers

Falcon-H1を用いた自然言語処理を可能にするライブラリです。高性能な言語モデルを使って、様々なタスクを効率的に実行できます。

🚀 クイックスタート

Falcon-H1モデルを使用するには、transformers、vLLM、またはllama.cppライブラリを利用できます。以下に各ライブラリでの使用方法を示します。

✨ 主な機能

様々な自然言語処理タスクに対応しています。
高性能なFalcon-H1モデルを活用し、高い精度でタスクを実行できます。
複数のライブラリをサポートしており、使いやすいインターフェースを提供します。

📦 インストール

`transformers`のインストール

最新バージョンのtransformersをインストールするには、以下のコマンドを実行します。

pip install git+https://github.com/huggingface/transformers.git

`vLLM`のインストール

vLLMをインストールし、サーバーを起動するには、以下のコマンドを実行します。

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

`llama.cpp`のインストール

llama.cppのフォーク版をインストールして使用することができます。以下のリポジトリを参照してください。 https://github.com/tiiuae/llama.cpp-Falcon-H1

💻 使用例

基本的な使用法

`transformers`を使用したテキスト生成

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

`vLLM`を使用したサーバー起動

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

📚 ドキュメント

モデル詳細

属性	詳情
モデルタイプ	Causal decoder-only
アーキテクチャ	Hybrid Transformers + Mamba architecture
言語	English, Multilingual
ライセンス	Falcon-LLM License
開発元	https://www.tii.ae

学習詳細

このモデルの学習プロトコルの詳細については、Falcon-H1 technical blogpostを参照してください。

評価

Falcon-H1シリーズは、様々なタスク、特に推論タスクで非常に良好な性能を発揮します。

タスク	Falcon-H1-34B	Qwen3-32B	Qwen2.5-72B	Qwen2.5-32B	Gemma3-27B	Llama3.3-70B	Llama4-scout
一般的なタスク
BBH	70.68	62.47	72.52	68.72	67.28	69.15	64.9
ARC-C	61.01	48.98	46.59	44.54	54.52	63.65	56.14
TruthfulQA	65.27	58.58	69.8	70.28	64.26	66.15	62.74
HellaSwag	81.94	68.89	68.79	73.95	57.25	70.24	65.03
MMLU	84.05	80.89	84.42	82.8	78.01	82.08	80.4
数学タスク
GSM8k	83.62	88.78	82.26	78.47	90.37	93.71	90.37
MATH-500	83.8	82.0	83.6	82.2	90.0	70.6	83.2
AMC-23	69.38	67.34	67.34	68.75	77.81	39.38	69.06
AIME-24	23.75	27.71	17.29	17.92	27.5	12.92	27.92
AIME-25	16.67	19.79	15.21	11.46	22.71	1.25	8.96
科学タスク
GPQA	41.53	30.2	37.67	34.31	36.49	31.99	31.8
GPQA_Diamond	49.66	49.49	44.95	40.74	47.47	42.09	51.18
MMLU-Pro	58.73	54.68	56.35	56.63	47.81	53.29	55.58
MMLU-stem	83.57	81.64	82.59	82.37	73.55	74.88	75.2
コードタスク
HumanEval	87.2	90.85	87.2	90.24	86.59	83.53	85.4
HumanEval+	81.71	85.37	80.49	82.32	78.05	79.87	78.7
MBPP	83.86	86.24	89.68	87.83	88.36	88.09	81.5
MBPP+	71.43	71.96	75.4	74.07	74.07	73.81	64.8
LiveCodeBench	49.71	45.01	54.6	49.12	39.53	40.31	40.12
CRUXEval	73.07	78.45	75.63	73.5	74.82	69.53	68.32
命令追従タスク
IFEval	89.37	86.97	86.35	81.79	83.19	89.94	86.32
Alpaca-Eval	48.32	64.21	49.29	39.26	56.16	38.27	36.26
MTBench	9.2	9.05	9.16	9.09	8.75	8.98	8.98
LiveBench	46.26	63.05	54.03	52.92	55.41	53.11	54.21

詳細なベンチマークについては、our release blogpostを参照してください。

有用なリンク

our release blogpostを参照してください。
質問がある場合や、研究者や開発者と交流したい場合は、our discord serverにご参加ください。

📄 ライセンス

このプロジェクトは、Falcon-LLM Licenseの下でライセンスされています。

📖 引用

Falcon-H1ファミリーのモデルがあなたの研究に役立った場合、以下のように引用してください。

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}