gpt2-small-indonesian-522Mオープンソースモデル - 無料でのデプロイでインドネシア語のテキスト生成をサポート

ホーム

Gpt2 Small Indonesian 522M

cahyaによって開発

これはインドネシア語ウィキペディアデータで事前学習されたGPT2-smallモデルで、インドネシア語テキスト生成タスクに特化しています。

大規模言語モデルその他オープンソースライセンス:MIT #インドネシア語生成 #小規模事前学習 #ウィキペディアコーパス

ダウンロード数 1,900

リリース時間 : 3/2/2022

モデル概要

このモデルは522MBのインドネシア語ウィキペディアデータで因果的言語モデリング(CLM)目標を用いて事前学習され、インドネシア語テキスト生成をサポートします。モデルは大文字小文字を区別せず、様々な下流NLPタスクに適用可能です。

モデル特徴

インドネシア語最適化

インドネシア語に特化して事前学習されており、インドネシア語テキスト生成タスクで良好なパフォーマンスを発揮

大文字小文字を区別しない

モデルは大文字小文字を区別せず、'indonesia'と'Indonesia'は同じとみなされる

効率的なトークン化

バイトレベルのバイトペアエンコーディング(BPE)を採用、語彙数52,000でUnicode文字を効果的に処理可能

モデル能力

インドネシア語テキスト生成

言語モデル特徴抽出

文脈理解

使用事例

教育/文化

歴史テキスト生成

インドネシア歴史に関する一貫性のあるテキストを生成

例示されているMajapahit王国に関する歴史記述の生成

コンテンツ作成

インドネシア語コンテンツ自動生成

インドネシア語記事やストーリーなどの作成を補助

🚀 インドネシア語GPT2スモールモデル

このモデルは、インドネシア語のWikipediaデータを用いて、因果言語モデリング（CLM）の目的で事前学習されたGPT2-smallモデルです。このモデルは大文字と小文字を区別せず、「indonesia」と「Indonesia」を同じとみなします。

🚀 クイックスタート

このモデルは、インドネシア語のデータセットを用いて事前学習された言語モデルの一つです。下流タスク（テキスト分類、テキスト生成など）での使用方法の詳細は、Transformer based Indonesian Language Modelsを参照してください。

✨ 主な機能

このモデルは、因果言語モデリング（CLM）の目的で事前学習されており、テキスト生成や下流タスクでの使用に適しています。

📦 インストール

このモデルは、transformersライブラリを使用して直接利用できます。以下のコードを参考にしてください。

💻 使用例

基本的な使用法

>>> from transformers import pipeline, set_seed
>>> generator = pipeline('text-generation', model='cahya/gpt2-small-indonesian-522M')
>>> set_seed(42)
>>> generator("Kerajaan Majapahit adalah", max_length=30, num_return_sequences=5, num_beams=10)

[{'generated_text': 'Kerajaan Majapahit adalah sebuah kerajaan yang pernah berdiri di Jawa Timur pada abad ke-14 hingga abad ke-15. Kerajaan ini berdiri pada abad ke-14'}, 
{'generated_text': 'Kerajaan Majapahit adalah sebuah kerajaan yang pernah berdiri di Jawa Timur pada abad ke-14 hingga abad ke-16. Kerajaan ini berdiri pada abad ke-14'}, 
{'generated_text': 'Kerajaan Majapahit adalah sebuah kerajaan yang pernah berdiri di Jawa Timur pada abad ke-14 hingga abad ke-15. Kerajaan ini berdiri pada abad ke-15'}, 
{'generated_text': 'Kerajaan Majapahit adalah sebuah kerajaan yang pernah berdiri di Jawa Timur pada abad ke-14 hingga abad ke-16. Kerajaan ini berdiri pada abad ke-15'}, 
{'generated_text': 'Kerajaan Majapahit adalah sebuah kerajaan yang pernah berdiri di Jawa Timur pada abad ke-14 hingga abad ke-15. Kerajaan ini merupakan kelanjutan dari Kerajaan Majapahit yang'}]

高度な使用法

PyTorchでの特徴抽出

from transformers import GPT2Tokenizer, GPT2Model

model_name='cahya/gpt2-small-indonesian-522M'
tokenizer = GPT2Tokenizer.from_pretrained(model_name)
model = GPT2Model.from_pretrained(model_name)
text = "Silakan diganti dengan text apa saja."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)

TensorFlowでの特徴抽出

from transformers import GPT2Tokenizer, TFGPT2Model

model_name='cahya/gpt2-small-indonesian-522M'
tokenizer = GPT2Tokenizer.from_pretrained(model_name)
model = TFGPT2Model.from_pretrained(model_name)
text = "Silakan diganti dengan text apa saja."
encoded_input = tokenizer(text, return_tensors='tf')
output = model(encoded_input)