G

Gpt Neox 20b

由EleutherAI開發
GPT-NeoX-20B是一個擁有200億參數的開源自迴歸語言模型,基於GPT-3架構設計,在the Pile數據集上訓練而成。
下載量 345.06k
發布時間 : 4/7/2022

模型概述

GPT-NeoX-20B是一個大型英語語言模型,主要用於研究目的,能夠生成連貫的文本並學習語言內部表示。

模型特點

大規模參數
擁有200億參數,提供強大的語言理解和生成能力
開源模型
基於Apache 2.0許可證發佈,允許研究和商業用途
GPT-3架構
採用與GPT-3相似的Transformer架構設計
旋轉位置嵌入
使用RoPE(Rotary Position Embedding)進行位置編碼

模型能力

英語文本生成
語言理解
文本補全
語言特徵提取

使用案例

研究
語言模型研究
用於研究大規模語言模型的行為和特性
下游任務特徵提取
作為基礎模型提取特徵用於其他NLP任務
應用開發
文本生成應用
經過微調後可用於開發文本生成類應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase