O

Olmo2 11B SuperBPE T180k

由UW開發
110億參數大語言模型,採用創新的SuperBPE分詞器訓練,支持超詞單元識別和子詞分詞能力。
下載量 29
發布時間 : 3/19/2025

模型概述

基於OLMo2-7B架構擴展的大語言模型,採用SuperBPE分詞器進行訓練,具備更強的文本理解和生成能力。

模型特點

SuperBPE分詞器
創新性地引入超詞單元(可跨越單詞邊界),同時保留子詞分詞能力。
高效上下文處理
3000token上下文窗口,等效於BPE模型4096token的字節級上下文容量。
大規模訓練
2380億token訓練量,20萬詞表規模。

模型能力

文本生成
自然語言理解

使用案例

文本生成
創意寫作
生成連貫、有創意的文本內容。
代碼生成
輔助生成編程代碼片段。
自然語言處理
文本摘要
自動生成文本的簡潔摘要。
問答系統
構建智能問答系統。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase