Model Selection

Masked language modeling

# Masked language modeling

Chinesebert Base

ChineseBERT is a Chinese pre-trained model that integrates glyph and pinyin information, optimized for Chinese text processing.

Large Language Model

Transformers Chinese

SyllaBERTa is an experimental Transformer-based masked language model specifically designed for processing Ancient Greek texts, employing syllable-level tokenization.

Large Language Model

Transformers Other

Moderncamembert Base

ModernCamemBERT is a French language model pre-trained on a 1T high-quality French text corpus. It is the French version of ModernBERT, focusing on long contexts and efficient inference speed.

Large Language Model

Transformers French

RNA foundation model pre-trained on non-coding RNA data using masked language modeling (MLM) objective

Safetensors Other

medBERT-base is a BERT-based model focused on masked language modeling tasks for medical and gastroenterology texts.

Large Language Model

Transformers English

A fine-tuned version based on the XLM-Roberta base model, using RoPE (Rotary Position Embedding) to replace the original positional embeddings, supporting 2048 sequence length

Large Language Model

Ankh3 is a protein language model based on the T5 architecture. It is pre - trained by jointly optimizing masked language modeling and sequence completion tasks, and is suitable for protein feature extraction and sequence analysis.

RiNALMo is a non-coding RNA (ncRNA) model pre-trained based on the masked language modeling (MLM) objective, trained through self-supervised learning on a large number of non-coding RNA sequences.

Protein Model Other

Caduceus Ps Seqlen 131k D Model 256 N Layer 16

Caduceus-PS is a DNA sequence modeling model with reverse-complement equivariance, designed for processing long sequences.

Molecular Model

Multilingual Albert Base Cased 128k

A multilingual ALBERT model pretrained with masked language modeling (MLM) objective, supporting 60+ languages, featuring a lightweight architecture with parameter sharing

Large Language Model

Transformers Supports Multiple Languages

Multilingual Albert Base Cased 32k

Multilingual ALBERT model pretrained with masked language modeling objective, supporting 50+ languages, case-sensitive

Large Language Model

Transformers Supports Multiple Languages

Albertina 1b5 Portuguese Ptbr Encoder

Albertina 1.5B PTBR is a foundational large language model for the Brazilian Portuguese variant. It is an encoder belonging to the BERT family, based on the Transformer neural network architecture and developed on the basis of the DeBERTa model.

Large Language Model

Transformers Other

Tahrirchi Bert Base

TahrirchiBERT-base is an encoder-only Transformer text model for Uzbek (Latin script) with 110 million parameters, pre-trained using masked language modeling objectives.

Large Language Model

Transformers Other

State-of-the-art BERT language model suite for Modern Hebrew

Large Language Model

Transformers Other

Parlbert German Law

BERT model trained on German legal data, specialized in legal text processing

Large Language Model

Transformers German

BEREL 3.0 is an embedding model based on the BERT architecture, specifically designed for rabbinic coded language, providing support for relevant research and applications.

Large Language Model

Transformers Other

BERTikal is a case-sensitive BERT base model for Brazilian legal language, trained on Brazilian legal texts and based on the BERTimbau checkpoint.

Large Language Model

Transformers Other

A RoBERTa-based masked language model specifically pretrained for news text

Large Language Model

Transformers English

ARBERTv2 is an upgraded BERT model trained on Modern Standard Arabic (MSA) with a corpus of 243GB text, containing 27.8 billion tokens.

Large Language Model

Transformers Arabic

NorBERT 3 is a next-generation Norwegian language model based on the BERT architecture, supporting both Bokmål and Nynorsk written Norwegian.

Large Language Model

Transformers Other

A Mixture of Experts (MoE) model trained on masked language modeling tasks, with a parameter scale of 1.6 trillion. It uses an architecture similar to T5 but replaces the feed - forward layer with a sparse MLP layer.

Large Language Model

Transformers English

Bart Base Cantonese

This is a Cantonese model based on the base version of BART, obtained through second-phase pre-training on the LIHKG dataset.

Large Language Model Other

Esm2 T36 3B UR50D

ESM-2 is a next-generation protein model trained with masked language modeling objectives, suitable for fine-tuning on various downstream tasks with protein sequences as input.

Esm2 T30 150M UR50D

ESM-2 is a state-of-the-art protein model trained on masked language modeling objectives, suitable for fine-tuning on various protein sequence input tasks.

Esm2 T12 35M UR50D

ESM-2 is a cutting-edge protein model trained on masked language modeling objectives, suitable for various protein sequence analysis tasks

Esm2 T6 8M UR50D

ESM-2 is a next-generation protein model trained with masked language modeling objectives, suitable for fine-tuning on various protein sequence tasks.

Microbert Coptic Mx

This is a MicroBERT model for the Coptic language, pre-trained through masked language modeling and supervised XPOS tagging.

Large Language Model

Transformers Other

Efficient Mlm M0.40 801010

This model studies the effectiveness of masking 15% content in masked language modeling, employing pre-layer normalization techniques not currently supported by HuggingFace.

Large Language Model

A model pre-trained on Bulgarian language using Masked Language Modeling (MLM) objective, case-sensitive.

Large Language Model

Transformers Other

Bert Base Uncased

A BERT base model for the English language, pre-trained using the Masked Language Modeling (MLM) objective, case-insensitive.

Large Language Model

Transformers English

Roberta TR Medium Morph 44k

A RoBERTa model for Turkish language, pre-trained with morphological-level tokenization and masked language modeling objectives, suitable for Turkish NLP tasks.

Large Language Model

Transformers Other

Roberta TR Medium Bpe 44k

A RoBERTa model based on Turkish, pre-trained with masked language modeling (MLM) objective, case-insensitive.

Large Language Model

Transformers Other

Roberta TR Medium Bpe 16k

A RoBERTa model pre-trained on Turkish with masked language modeling (MLM) objective, case-insensitive, medium-sized architecture.

Large Language Model

Transformers Other

Chinese Roberta L 8 H 512

A Chinese RoBERTa model pre-trained on CLUECorpusSmall, with a parameter scale of 8 layers and 512 hidden units, supporting masked language modeling tasks.

Large Language Model Chinese

Chinese Roberta L 6 H 256

A Chinese RoBERTa model pre-trained on CLUECorpusSmall, with a parameter scale of 8 layers and 512 hidden units.

Large Language Model Chinese

Batteryscibert Cased

A language model pre-trained on a large corpus of battery research papers, inherited from SciBERT-cased, specializing in battery domain text comprehension

Large Language Model

Transformers English

Uztext 568Mb Roberta BPE

UzRoBerta is a pre-trained Uzbek (Cyrillic script) model for masked language modeling and next sentence prediction.

Large Language Model

Mk Roberta Base

Masked language modeling pretrained model based on Macedonian language training with case-sensitive processing

Large Language Model Other

SportsBERT is a BERT model specialized in the sports domain, trained on a corpus of sports news, suitable for sports-related natural language processing tasks.

Large Language Model

Wobert Chinese Plus Base

WoBERT is a vocabulary-based Chinese BERT model developed by Zhuiyi Technology, specializing in Chinese text processing tasks.

Large Language Model Chinese

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase