S

Sinbert Large

NLPC-UOMによって開発
SinBERTはRoBERTaアーキテクチャに基づく僧伽羅語の事前学習言語モデルで、大型の僧伽羅語単言語コーパス(sin-cc-15M)で学習されています。
ダウンロード数 150
リリース時間 : 3/2/2022

モデル概要

SinBERTモデルは僧伽羅語のテキスト処理用に特別に設計されており、テキスト分類などの様々な自然言語処理タスクに適しています。

モデル特徴

僧伽羅語の最適化
僧伽羅語に特化して事前学習され、この言語のテキスト処理能力を最適化しています。
RoBERTaアーキテクチャに基づく
RoBERTaアーキテクチャを採用し、その優れた自然言語処理能力を引き継いでいます。
大規模な学習データ
sin-cc-15M大型僧伽羅語単言語コーパスを使用して学習されています。

モデル能力

テキスト分類
自然言語理解
テキスト特徴抽出

使用事例

テキスト分析
僧伽羅語のテキスト分類
僧伽羅語のテキストに対して分類タスクを行います。
LREC 2022論文で良好な分類性能が示されています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase