# OSCARデータセット

Tavbert Tr
トルコ語向けのBERTスタイルのマスク言語モデルで、文字レベルで動作し、SpanBERTのような文字スパンマスク手法を用いて事前学習されています。
大規模言語モデル Transformers その他
T
tau
15
1
Robit Roberta Base It
RobItはRoBERTaアーキテクチャに基づくイタリア語モデルで、Flaxフレームワークを使用してOSCARデータセットのイタリア語部分でゼロからトレーニングされました。
大規模言語モデル
R
flax-community
14
1
Sinhalaberto
これは、OSCARの僧伽羅語の重複除去データセットを基に訓練されたやや小さいモデルで、低リソースの僧伽羅語に基礎的なサポートを提供します。
大規模言語モデル その他
S
keshan
34
1
Tavbert He
文字操作に基づくヘブライ語BERTスタイルのマスク言語モデルで、SpanBERTと同様に文字フラグメントをマスキングして事前学習を行います。
大規模言語モデル Transformers その他
T
tau
116
1
Mongolian Gpt2
これはGPT2アーキテクチャに基づくモンゴル語テキスト生成モデルで、流暢なモンゴル語テキストを生成することを目的としています。
大規模言語モデル その他
M
flax-community
75
3
Gujarati XLM R Base
このモデルはXLM-RoBERTaの基本バリアントを基にしており、グジャラート語とOSCARの単一言語データセットでファインチューニングされており、グジャラート語の自然言語処理タスクに適しています。
大規模言語モデル Transformers その他
G
ashwani-tanwar
22
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase