O

Opt 66b

由facebook開發
OPT是由Meta AI開發的大型語言模型套件,包含125M至175B參數的僅解碼器預訓練變換器,旨在對標GPT-3性能並向研究社區開放。
下載量 7,697
發布時間 : 6/23/2022

模型概述

OPT是基於英文文本預訓練的大型語言模型,採用因果語言建模目標,支持文本生成和下游任務微調。

模型特點

開放研究導向
專門為學術研究設計,促進大語言模型的可復現性和社會影響研究
GPT-3級性能
模型規模與性能對標GPT-3系列,採用最新訓練實踐
高效訓練框架
使用992塊A100 GPU在33天內完成175B模型訓練

模型能力

文本生成
零樣本學習
小樣本學習
下游任務提示評估

使用案例

學術研究
模型偏見研究
分析生成文本中的社會偏見表現
示例顯示職業描述存在性別偏見傾向
毒性內容檢測
研究模型生成有害內容的概率
文本生成
創意寫作
基於提示生成連貫文本
可生成符合語境的後續句子
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase