fairseq-dense-125M开源模型 - 兼容Hugging Face transformers，应用场景更广泛

Fairseq Dense 125M

由 KoboldAI 开发

这是对Artetxe等人论文中125M参数密集模型的Hugging Face transformers兼容版本转换

下载量 27

发布时间 : 3/2/2022

模型简介

该模型是基于Artetxe等人论文《Efficient Large Scale Language Modeling with Mixtures of Experts》中原生密集125M参数模型的转换版本，适用于大规模语言建模任务。

大规模语言建模

专注于高效的大规模语言建模任务

Hugging Face兼容

已转换为与Hugging Face transformers兼容的版本

密集参数结构

采用密集参数结构而非混合专家(MoE)架构

文本生成

语言理解

自然语言处理

开放大语言模型评估

在HuggingFace开放大语言模型排行榜上进行评估

平均得分26.0，在多个基准测试中表现