G

Gpt1

由lgaalves開發
OpenAI發佈的基於Transformer的語言模型,通過大規模語料庫預訓練而成,具有強大的文本生成能力
下載量 310
發布時間 : 9/25/2023

模型概述

基於Transformer架構的因果語言模型,主要用於文本生成和語言理解任務

模型特點

長距離依賴建模
能夠處理長達512個token的序列,有效捕捉長距離依賴關係
遷移學習能力
可通過微調適應多種下游NLP任務
高效預訓練
採用字節對編碼(BPE)詞彙表,包含40,000個合併token

模型能力

文本生成
語言建模
文本分類
問答系統
語義相似度計算

使用案例

自然語言處理
文本生成
生成連貫的文本內容
可生成多種風格的文本
文本分類
對文本進行情感分析或主題分類
在SST-2情感分析數據集上達到91.3%準確率
問答系統
閱讀理解
回答基於給定文本的問題
在RACE數據集上達到59.0%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase