msmarco - distilbert - word2vec256k - MLM_785k_emb_updated開源模型

Home

Msmarco Distilbert Word2vec256k MLM 785k Emb Updated

Developed by vocab-transformers

該模型基於DistilBERT架構，詞彙表大小為256k，通過word2vec初始化，並在MS MARCO語料庫上進行了785k步的MLM訓練。

大型語言模型

Transformers

#MS MARCO預訓練 #word2vec初始化嵌入 #大規模詞彙表(256k)

Downloads 17

Release Time : 3/2/2022

Model Overview

這是一個基於DistilBERT的預訓練語言模型，主要用於自然語言處理任務，如文本分類、問答和信息檢索等。

Model Features

大詞彙表

詞彙表大小為256k，通過word2vec初始化，能夠更好地處理多樣化的文本數據。

高效訓練

基於DistilBERT架構，模型在保持性能的同時減少了參數量，提高了訓練和推理效率。

MS MARCO語料庫訓練

模型在MS MARCO語料庫上進行了785k步的MLM訓練，適用於信息檢索相關任務。

Model Capabilities

文本分類

問答系統

信息檢索

掩碼語言建模

Use Cases

信息檢索

文檔檢索

利用模型對文檔進行編碼，實現高效的文檔檢索。

問答系統

開放域問答

結合檢索和閱讀理解模型，構建開放域問答系統。

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Msmarco Distilbert Word2vec256k MLM 785k Emb Updated

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 模型