msmarco - distilbert - word2vec256k - MLM_785k_emb_updated开源模型

首页

Msmarco Distilbert Word2vec256k MLM 785k Emb Updated

由 vocab-transformers 开发

该模型基于DistilBERT架构，词汇表大小为256k，通过word2vec初始化，并在MS MARCO语料库上进行了785k步的MLM训练。

大型语言模型

Transformers

#MS MARCO预训练 #word2vec初始化嵌入 #大规模词汇表(256k)

下载量 17

发布时间 : 3/2/2022

模型简介

这是一个基于DistilBERT的预训练语言模型，主要用于自然语言处理任务，如文本分类、问答和信息检索等。

模型特点

大词汇表

词汇表大小为256k，通过word2vec初始化，能够更好地处理多样化的文本数据。

高效训练

基于DistilBERT架构，模型在保持性能的同时减少了参数量，提高了训练和推理效率。

MS MARCO语料库训练

模型在MS MARCO语料库上进行了785k步的MLM训练，适用于信息检索相关任务。

模型能力

文本分类

问答系统

信息检索

掩码语言建模

使用案例

信息检索

文档检索

利用模型对文档进行编码，实现高效的文档检索。

问答系统

开放域问答

结合检索和阅读理解模型，构建开放域问答系统。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Msmarco Distilbert Word2vec256k MLM 785k Emb Updated

模型简介

模型特点

模型能力

使用案例

🚀 模型