O

Olmo 2 0425 1B

由allenai開發
OLMo 2 1B是艾倫人工智能研究所推出的開放語言模型系列中最小的模型,基於OLMo-mix-1124預訓練,並在中期訓練階段使用Dolmino-mix-1124數據集。
下載量 13.31k
發布時間 : 4/17/2025

模型概述

OLMo 2 1B是一個基於Transformer的自迴歸語言模型,旨在推動語言模型科學研究,支持英語文本生成任務。

模型特點

開放源代碼
模型代碼、檢查點、訓練日誌及相關細節已全部開源,便於研究和復現。
兩階段訓練
採用初始預訓練和中期訓練兩階段策略,使用高質量數據集優化模型性能。
量化支持
支持8位量化,可在資源受限的環境中高效運行。

模型能力

英語文本生成
語言模型研究
指令跟隨

使用案例

學術研究
語言模型科學研究
用於研究語言模型的訓練、優化和評估方法。
文本生成
內容創作
生成連貫的英語文本內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase