F

Fox 1 1.6B

由tensoropera開發
Fox-1-1.6B是由TensorOpera AI開發的16億參數小型語言模型,採用分組查詢注意力機制,訓練數據達3萬億文本和代碼。
下載量 1,741
發布時間 : 6/13/2024

模型概述

Fox-1-1.6B是一個基於解碼器的小型語言模型,適用於文本生成和代碼理解任務。它經過3階段數據課程訓練,支持8K序列長度。

模型特點

高效注意力機制
採用分組查詢注意力(GQA),4個鍵值頭和16個注意力頭,提升推理速度
大規模訓練數據
使用3萬億文本和代碼數據進行3階段課程訓練
長序列支持
支持8K長度的序列處理

模型能力

文本生成
代碼理解
少樣本學習

使用案例

自然語言處理
文本生成
生成連貫的文本內容
問答系統
構建知識問答應用
編程輔助
代碼補全
輔助程序員完成代碼編寫
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase