O

Olmo2 8B SuperBPE T160k

由UW開發
80億參數模型,採用創新的SuperBPE分詞器,結合子詞和超詞標記,推理效率比傳統BPE模型高30%。
下載量 28
發布時間 : 3/19/2025

模型概述

基於OLMo2 7B架構構建的大語言模型,採用SuperBPE分詞器,支持更高效的文本編碼和生成。

模型特點

SuperBPE分詞器
結合傳統子詞標記和創新的超詞標記,跨越多詞邊界,顯著提升編碼效率。
高效推理
相比傳統BPE模型,推理階段的平均效率高出30%。
大詞彙量
詞彙量達20萬,其中16萬為子詞標記,4萬為超詞標記。
長上下文支持
上下文長度為2,884個標記,相當於傳統BPE模型4,096標記的實際字節量。

模型能力

文本生成
高效文本編碼

使用案例

自然語言處理
文本生成
生成連貫、上下文相關的文本內容。
高質量文本輸出,效率提升30%。
文本編碼
高效編碼長文本,減少標記數量。
更少的標記編碼等量文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase