# ウィキペディアコーパス

Multilingual Albert Base Cased 128k
Apache-2.0
マスク言語モデリング(MLM)目標で事前学習された多言語ALBERTモデルで、60種以上の言語をサポートし、パラメータ共有の軽量アーキテクチャを持つ
大規模言語モデル Transformers 複数言語対応
M
cservan
277
2
Multilingual Albert Base Cased 32k
Apache-2.0
マスク言語モデリングの目的で事前学習された多言語ALBERTモデルで、50種以上の言語をサポートし、大文字小文字を区別します。
大規模言語モデル Transformers 複数言語対応
M
cservan
243
2
Electra Small Japanese Generator
日本語ウィキペディアで事前学習されたELECTRAモデルで、日本語テキスト処理タスクに適しています。
大規模言語モデル Transformers 日本語
E
izumi-lab
16
0
Bert Base Arabic
現代標準アラビア語と一部の方言をサポートする事前学習済みアラビア語BERTベース言語モデル
大規模言語モデル アラビア語
B
asafaya
14.40k
38
Gpt2 Small Indonesian 522M
MIT
これはインドネシア語ウィキペディアデータで事前学習されたGPT2-smallモデルで、インドネシア語テキスト生成タスクに特化しています。
大規模言語モデル その他
G
cahya
1,900
9
Gpt2 Small Arabic
gpt2-smallアーキテクチャでトレーニングされたアラビア語ウィキペディアデータセットのGPT2モデルで、テキスト生成タスクに適しています。
大規模言語モデル アラビア語
G
akhooli
1,066
15
Bert Base Indonesian 522M
MIT
インドネシア語ウィキペディアで事前学習されたBERTベースモデルで、マスク言語モデリング(MLM)目標で訓練されており、大文字小文字を区別しません。
大規模言語モデル その他
B
cahya
2,799
25
Wangchanberta Base Wiki Newmm
タイ語ウィキペディアで事前学習されたRoBERTa BASEモデルで、タイ語テキスト処理タスクに適しています。
大規模言語モデル その他
W
airesearch
115
2
Slovakbert
MIT
スロバキア語で訓練された事前学習モデルで、マスク言語モデリング(MLM)の目標を採用し、大文字と小文字を区別します。
大規模言語モデル Transformers その他
S
gerulata
5,009
23
Tinybert General 4L 312D De
これはドイツ語に最適化されたTinyBERTモデルで、BERTベースケースドモデルから蒸留により作成され、自然言語処理タスクに適しています。
大規模言語モデル Transformers ドイツ語
T
dvm1983
269
3
Bert Base En Tr Cased
Apache-2.0
bert-base-multilingual-casedを基にカスタマイズした簡素化バージョンで、英語とトルコ語の処理をサポートし、元のモデルの精度を維持
大規模言語モデル その他
B
Geotrend
21
0
Bert Base Japanese Upos
日本語ウィキペディアテキストで事前学習されたBERTモデル、品詞タグ付けと依存構文解析用
シーケンスラベリング Transformers 複数言語対応
B
KoichiYasuoka
40
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase