G

Gpt2 Large Bne

由BSC-LT開發
基於Transformer架構的西班牙語大語言模型,使用西班牙國家圖書館2009-2019年間的網絡爬取內容訓練
下載量 162
發布時間 : 3/2/2022

模型概述

該模型是專門針對西班牙語優化的GPT-2 large版本,使用迄今最大規模的西班牙語語料庫進行預訓練,適用於西班牙語文本生成和理解任務

模型特點

大規模西班牙語訓練
使用西班牙國家圖書館2009-2019年間570GB高質量西班牙語語料訓練
專業預處理
語料經過嚴格的分句處理、語言檢測、劣質語句過濾及內容去重等預處理流程
高性能架構
基於GPT-2 large架構,具有強大的文本生成能力

模型能力

西班牙語文本生成
西班牙語文本理解
西班牙語語言建模

使用案例

自然語言處理
西班牙語文本自動生成
生成符合西班牙語語法和習慣的連貫文本
西班牙語語言模型研究
作為基礎模型用於西班牙語NLP研究
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase