gpt2-large-japanese開源日語模型 - 免費支持高質量日語文本生成任務

首頁

Gpt2 Large Japanese

由abeja開發

由ABEJA公司訓練的日語大型GPT-2模型，支持日語文本生成任務

大型語言模型

Transformers

支持多種語言開源協議:MIT #日語文本生成 #大語言模型 #日文寫作輔助

下載量 960

發布時間 : 8/29/2022

模型概述

這是一個基於GPT-2架構的大型日語語言模型，專門針對日語文本生成任務進行優化訓練。

模型特點

日語專用模型

專門針對日語文本進行訓練和優化

多樣化生成

支持多種採樣策略生成多樣化的文本

預訓練數據豐富

使用了日語CC-100、日語維基百科和日語OSCAR等多個高質量數據集

模型能力

日語文本生成

上下文理解

多樣化文本採樣

使用案例

內容創作

文章續寫

根據給定的開頭續寫完整的文章

生成流暢、連貫的日語文本

AI輔助寫作

創意寫作

幫助作家進行創意構思和內容生成

提供多樣化的寫作思路

🚀 gpt2-large-japanese

本倉庫提供了一個大尺寸的日語GPT - 2模型。該模型由ABEJA, Inc訓練。

🚀 快速開始

📦 安裝指南

首先，安裝sentencepiece。我們已確認其在2022年8月的最新版本下的運行情況。（若無需安裝可跳過。）

pip install sentencepiece

💻 使用示例

基礎用法

當使用pipeline進行文本生成時：

from transformers import pipeline

generator = pipeline("text-generation", model="abeja/gpt2-large-japanese")
generated = generator(
    "人とAIが協調するためには、",
    max_length=30,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50,
    pad_token_id=3
)
print(*generated, sep="\n")

"""
[out]
{'generated_text': '人とAIが協調するためには、社會的なルールをきちんと理解して、人と共存し、協働して生きていくのが重要だという。'}
{'generated_text': '人とAIが協調するためには、それぞれが人間性を持ち、またその人間性から生まれるインタラクションを調整しなければならないことはいうまで'}
{'generated_text': '人とAIが協調するためには、AIが判斷すべきことを人間が決める必要がある。人工知能の目的は、人間の知性、記憶、理解、'}
"""

高級用法

使用PyTorch時：

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("abeja/gpt2-large-japanese")
model = AutoModelForCausalLM.from_pretrained("abeja/gpt2-large-japanese")

input_text = "人とAIが協調するためには、"
input_ids = tokenizer.encode(input_text, return_tensors="pt")

gen_tokens = model.generate(
    input_ids,
    max_length=100,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50,
    pad_token_id=tokenizer.pad_token_id
)
for gen_text in tokenizer.batch_decode(gen_tokens, skip_special_tokens=True):
    print(gen_text)

使用TensorFlow時：

from transformers import AutoTokenizer, TFAutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("abeja/gpt2-large-japanese")
model = TFAutoModelForCausalLM.from_pretrained("abeja/gpt2-large-japanese", from_pt=True)

input_text = "人とAIが協調するためには、"
input_ids = tokenizer.encode(input_text, return_tensors="tf")

gen_tokens = model.generate(
    input_ids,
    max_length=100,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50,
    pad_token_id=tokenizer.pad_token_id
)
for gen_text in tokenizer.batch_decode(gen_tokens, skip_special_tokens=True):
    print(gen_text)