F

Falcon H1 1.5B Base

由tiiuae開發
Falcon-H1是由TII開發的混合Transformers + Mamba架構的僅解碼因果模型,支持英語和多語言任務。
下載量 454
發布時間 : 5/1/2025

模型概述

Falcon-H1是一個高效的混合架構語言模型,結合了Transformers和Mamba架構的優勢,適用於多種自然語言處理任務。

模型特點

混合架構
結合Transformers和Mamba架構的優勢,提高模型效率和性能。
多語言支持
支持英語和多語言任務,具有較強的語言理解能力。
高效推理
在多種推理任務上表現優異,包括數學和科學任務。

模型能力

文本生成
推理任務
多語言支持
代碼生成

使用案例

通用任務
通用問答
用於回答各種通用問題,表現優於同類模型。
在BBH任務上得分為46.57,優於Qwen3-1.7B和Gemma3-1B等模型。
數學任務
數學推理
解決數學問題和推理任務。
在GSM8k任務上得分為52.01,在MATH lvl5任務上得分為20.39。
代碼生成
代碼生成
生成和補全代碼片段。
在HumanEval任務上得分為50.0,在MBPP任務上得分為65.08。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase