モデル選定

マスク言語モデリング

# マスク言語モデリング

Llm Jp Modernbert Base

modernBERT-baseアーキテクチャに基づく日本語大規模言語モデル、最大8192のシーケンス長をサポート、3.4TBの日本語コーパスで訓練

大規模言語モデル

Transformers 日本語

SyllaBERTaは、古代ギリシャ語テキスト処理のために設計された、音節レベル分かち書きを採用した実験的なTransformerベースのマスク言語モデルです。

大規模言語モデル

Transformers その他

DUOはテキスト生成用の事前学習モデルで、マスク言語モデリングタスクに使用でき、OpenWebTextコーパスで訓練され、良好な性能を持っています。

大規模言語モデル

Transformers 英語

Moderncamembert Cv2 Base

1兆の高品質なフランス語テキストで事前学習されたフランス語言語モデル、ModernBERTのフランス語版

大規模言語モデル

Transformers フランス語

Moderncamembert Base

ModernCamemBERTは1Tの高品質なフランス語テキストコーパスで事前学習されたフランス語言語モデルで、ModernBERTのフランス語版であり、長いコンテキストと効率的な推論速度に焦点を当てています。

大規模言語モデル

Transformers フランス語

非コードRNAデータに基づき、マスク言語モデリング（MLM）目標で事前学習されたRNA基礎モデル

タンパク質モデルその他

DUOはTransformersライブラリに基づく事前学習モデルで、マスク言語モデリングタスクに特化しており、自然言語処理分野に適用されます。

大規模言語モデル

Transformers 英語

medBERT-baseはBERTベースのモデルで、医学および消化器学テキストのマスク言語モデリングタスクに特化しています。

大規模言語モデル

Transformers 英語

XLM-Robertaベースモデルをファインチューニングしたバージョンで、RoPE（回転位置エンコーディング）を元の位置埋め込みに置き換え、2048シーケンス長をサポート

大規模言語モデル

Camembertv2 Base

CamemBERTv2は2750億のフランス語テキストコーパスで事前学習されたフランス語言語モデルで、CamemBERTの第2世代バージョンです。RoBERTaアーキテクチャを採用し、トークナイザーとトレーニングデータを最適化しました。

大規模言語モデル

Transformers フランス語

Ankh3はT5アーキテクチャに基づくタンパク質言語モデルで、マスク言語モデリングと配列補完タスクを連合最適化することで事前学習され、タンパク質の特徴抽出と配列分析に適しています。

タンパク質モデル

RiNALMoはマスク言語モデリング（MLM）目標で事前学習された非コードRNA（ncRNA）モデルで、大量の非コードRNA配列上で自己教師あり方式で訓練されています。

タンパク質モデルその他

Roberta Kaz Large

RoBERTaアーキテクチャに基づくカザフ語言語モデルで、RobertaForMaskedLMを使用してゼロからトレーニングされ、カザフ語テキスト処理タスクに適しています。

大規模言語モデル

Transformers その他

Codeberta Small V1

CodeBERTaはRoBERTaアーキテクチャに基づくコード理解モデルで、複数のプログラミング言語向けに特別に訓練されており、コード関連タスクを効率的に処理できます。

大規模言語モデル

Transformers その他

SaudiBERTは、サウジアラビア方言テキストに特化した最初の事前学習大規模言語モデルで、大規模なサウジアラビアのツイッターとフォーラムのコーパスを基に訓練されています。

大規模言語モデル

Transformers アラビア語

Caduceus Ps Seqlen 131k D Model 256 N Layer 16

Caduceus-PSは逆相補等変性を持つDNA配列モデリングモデルで、長い配列処理のために設計されています。

分子モデル

Multilingual Albert Base Cased 128k

マスク言語モデリング(MLM)目標で事前学習された多言語ALBERTモデルで、60種以上の言語をサポートし、パラメータ共有の軽量アーキテクチャを持つ

大規模言語モデル

Transformers 複数言語対応

Multilingual Albert Base Cased 64k

マスク言語モデリング（MLM）目標で事前学習された多言語ALBERTモデル、64k語彙サイズをサポート、大文字小文字を区別

大規模言語モデル

Transformers 複数言語対応

Multilingual Albert Base Cased 32k

マスク言語モデリングの目的で事前学習された多言語ALBERTモデルで、50種以上の言語をサポートし、大文字小文字を区別します。

大規模言語モデル

Transformers 複数言語対応

Nasa Smd Ibm V0.1

IndusはRoBERTaベースのエンコーダー専用Transformerモデルで、NASA科学ミッション理事会(SMD)のアプリケーション領域に最適化されており、科学情報検索やインテリジェント検索に適しています。

大規模言語モデル

Transformers 英語

Albertina 1b5 Portuguese Ptbr Encoder

Albertina 1.5B PTBRは、ブラジルポルトガル語の変種を対象とした基礎的な大規模言語モデルで、BERTファミリーのエンコーダであり、Transformerニューラルネットワークアーキテクチャに基づき、DeBERTaモデルをベースに開発されています。

大規模言語モデル

Transformers その他

Tahrirchi Bert Base

TahrirchiBERT-baseはウズベク語（ラテン文字）のエンコーダー専用Transformerテキストモデルで、1.1億のパラメータを持ち、マスク言語モデリング目標で事前学習されています。

大規模言語モデル

Transformers その他

現代ヘブライ語の最先端BERT言語モデルスイート

大規模言語モデル

Transformers その他

Parlbert German Law

ドイツ語法律データで訓練されたBERTモデル、法律テキスト処理に特化

大規模言語モデル

Transformers ドイツ語

BEREL 3.0はBERTアーキテクチャに基づく埋め込みモデルで、ラビコード言語用に特別に設計され、関連する研究やアプリケーションにサポートを提供します。

大規模言語モデル

Transformers その他

BERTikalはブラジルの法律言語に特化した大文字小文字を区別するBERTベースモデルで、BERTimbauのチェックポイントを基に、ブラジルの法律テキストでトレーニングされています。

大規模言語モデル

Transformers その他

Albertina 100m Portuguese Ptbr Encoder

Albertina 100M PTBRはブラジルポルトガル語向けの基礎大規模言語モデルで、BERTファミリーのエンコーダに属し、Transformerニューラルネットワークアーキテクチャに基づき、DeBERTaモデルをベースに開発されました。

大規模言語モデル

Transformers その他

Albertina 100m Portuguese Ptpt Encoder

Albertina 100M PTPTは、ヨーロッパポルトガル語（ポルトガル）向けの基礎大規模言語モデルで、BERTファミリーのエンコーダーであり、Transformerニューラルネットワークアーキテクチャに基づき、DeBERTaモデルをベースに開発されています。

大規模言語モデル

Transformers その他

RoBERTaアーキテクチャに基づくニュース分野向けマスク言語モデルで、ニューステキストに特化して事前学習されています

大規模言語モデル

Transformers 英語

ARBERTv2は、現代標準アラビア語(MSA)をベースに訓練されたアップグレード版のBERTモデルで、訓練コーパスは243GBのテキストで、278億のトークンを含んでいます。

大規模言語モデル

Transformers アラビア語

NorBERT 3は、BERTアーキテクチャに基づく次世代のノルウェー語言語モデルで、書面ノルウェー語（Bokmål）と新ノルウェー語（Nynorsk）をサポートしています。

大規模言語モデル

Transformers その他

Bert Mlm Medium

マスク言語モデリング(MLM)事前学習目標を採用した中規模BERT言語モデル。

大規模言語モデル

マスク言語モデリングタスクでトレーニングされた混合エキスパート(MoE)モデルで、パラメータ規模は1.6兆に達し、T5に似たアーキテクチャを採用しているが、フィードフォワード層はスパースMLP層に置き換えられている

大規模言語モデル

Transformers 英語

Esm2 T36 3B UR50D

ESM-2はマスク言語モデリング目標で訓練された次世代タンパク質モデルで、タンパク質配列を入力とする様々な下流タスクのファインチューニングに適しています。

タンパク質モデル

My Awesome Eli5 Mlm Model

distilroberta-baseを微調整したモデル、具体的な用途は明記されていません

大規模言語モデル

Esm2 T12 35M UR50D

ESM-2はマスク言語モデリング目標で訓練された最先端のタンパク質モデルで、様々なタンパク質配列分析タスクに適用可能

タンパク質モデル

Esm2 T6 8M UR50D

ESM-2はマスク言語モデリング目標でトレーニングされた次世代タンパク質モデルで、タンパク質配列の様々なタスクのファインチューニングに適しています。

タンパク質モデル

Esm2 T48 15B UR50D

ESM-2はマスク言語モデリング目標で訓練された最先端のタンパク質モデルで、タンパク質配列に対する様々なタスクのファインチューニングに適しています。

タンパク質モデル

Esm2 T30 150M UR50D

ESM-2はマスク言語モデリング目標で訓練された最先端のタンパク質モデルで、タンパク質配列を入力とする様々なタスクの微調整に適しています。

タンパク質モデル

Microbert Coptic Mx

これはコプト語向けのMicroBERTモデルで、マスク言語モデリングとXPOSタグ付けの監視による事前学習が行われています。

大規模言語モデル

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase