fairseq-dense-125M開源模型 - 兼容Hugging Face transformers，應用場景更廣泛

Fairseq Dense 125M

由KoboldAI開發

這是對Artetxe等人論文中125M參數密集模型的Hugging Face transformers兼容版本轉換

下載量 27

發布時間 : 3/2/2022

模型概述

該模型是基於Artetxe等人論文《Efficient Large Scale Language Modeling with Mixtures of Experts》中原生密集125M參數模型的轉換版本，適用於大規模語言建模任務。

大規模語言建模

專注於高效的大規模語言建模任務

Hugging Face兼容

已轉換為與Hugging Face transformers兼容的版本

密集參數結構

採用密集參數結構而非混合專家(MoE)架構

文本生成

語言理解

自然語言處理

開放大語言模型評估

在HuggingFace開放大語言模型排行榜上進行評估

平均得分26.0，在多個基準測試中表現