O

Olmo2 8B SuperBPE T180k

由UW開發
80億參數大語言模型,採用創新的SuperBPE分詞器,比傳統BPE模型效率提升27%
下載量 160
發布時間 : 3/19/2025

模型概述

基於OLMo2 7B架構構建的大語言模型,採用SuperBPE分詞技術實現更高效的文本編碼

模型特點

SuperBPE分詞器
創新的分詞算法,結合子詞和超詞標記,比傳統BPE效率提升27%
高效編碼
3000標記的上下文長度可匹配傳統BPE模型4096標記的實際字節規模
大規模訓練
總訓練標記數達3310億,詞彙量20萬

模型能力

文本生成
高效文本編碼

使用案例

自然語言處理
高效文本處理
利用SuperBPE技術處理長文本
比傳統BPE模型效率提升27%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase