F

Falcon H1 1.5B Deep Base

由tiiuae開發
Falcon-H1是由TII開發的高效混合架構語言模型,結合Transformer與Mamba架構,支持多語言任務
下載量 194
發布時間 : 5/1/2025

模型概述

因果僅解碼器架構的混合Transformer+Mamba模型,專注於高效推理和多語言處理能力

模型特點

混合架構創新
結合Transformer的注意力機制與Mamba架構的高效序列建模能力
多語言支持
原生支持18種語言處理,包括東亞和阿拉伯語系
高效推理
在1B參數級別實現超越同類模型的推理效率

模型能力

多語言文本生成
複雜推理任務處理
編程代碼生成
數學問題求解
科學知識問答

使用案例

教育
多語言學習助手
支持18種語言的互動式學習
在MMLU多語言理解基準中表現優異
研發
科研輔助
處理STEM領域複雜問題
在MMLU-Pro科學基準測試中達41.07分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase