O

Olmo2 8B SuperBPE T180k

由 UW 开发
80亿参数大语言模型,采用创新的SuperBPE分词器,比传统BPE模型效率提升27%
下载量 160
发布时间 : 3/19/2025

模型简介

基于OLMo2 7B架构构建的大语言模型,采用SuperBPE分词技术实现更高效的文本编码

模型特点

SuperBPE分词器
创新的分词算法,结合子词和超词标记,比传统BPE效率提升27%
高效编码
3000标记的上下文长度可匹配传统BPE模型4096标记的实际字节规模
大规模训练
总训练标记数达3310亿,词汇量20万

模型能力

文本生成
高效文本编码

使用案例

自然语言处理
高效文本处理
利用SuperBPE技术处理长文本
比传统BPE模型效率提升27%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase