Gpt2 Large Bne
基於Transformer架構的西班牙語大語言模型,使用西班牙國家圖書館2009-2019年間的網絡爬取內容訓練
下載量 162
發布時間 : 3/2/2022
模型概述
該模型是專門針對西班牙語優化的GPT-2 large版本,使用迄今最大規模的西班牙語語料庫進行預訓練,適用於西班牙語文本生成和理解任務
模型特點
大規模西班牙語訓練
使用西班牙國家圖書館2009-2019年間570GB高質量西班牙語語料訓練
專業預處理
語料經過嚴格的分句處理、語言檢測、劣質語句過濾及內容去重等預處理流程
高性能架構
基於GPT-2 large架構,具有強大的文本生成能力
模型能力
西班牙語文本生成
西班牙語文本理解
西班牙語語言建模
使用案例
自然語言處理
西班牙語文本自動生成
生成符合西班牙語語法和習慣的連貫文本
西班牙語語言模型研究
作為基礎模型用於西班牙語NLP研究
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98