G

Granite 7b Base

由ibm-granite開發
IBM發佈的基於Apache-2.0許可證的開源大語言模型,復現了Meta的Llama2-7B架構,使用2T token數據訓練而成。
下載量 3,653
發布時間 : 4/19/2024

模型概述

Granite-7b-base是IBM研究院開發的基礎預訓練大模型,作為Llama2-7B的開源參考實現,主要用於文本生成和理解任務。

模型特點

開源商業友好
採用Apache-2.0許可證,允許商業使用和修改
數據透明
公開了訓練數據源和採樣比例,促進研究透明度
大規模訓練
基於2T token數據和100萬批次規模訓練

模型能力

英語文本生成
文本理解
代碼生成(有限)
問答系統

使用案例

研究開發
語言模型基準測試
作為Llama2架構的開源實現參考
在MMLU等基準測試中接近原版性能
商業應用
內容生成輔助
用於生成初版文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase