LongWriter-llama3.1-8bオープンソース長文生成モデル - 無料で10000文字を超える内容を一度に出力可能

ホーム

Longwriter Llama3.1 8b

THUDMによって開発

Meta-Llama-3.1-8Bをベースに訓練された長文生成モデルで、一度に10,000文字以上の内容を生成できます。

大規模言語モデル

Transformers

複数言語対応#超長テキスト生成 #中国語旅行ガイド #10,000文字以上の出力

ダウンロード数 2,016

リリース時間 : 8/12/2024

モデル概要

LongWriter-llama3.1-8bは長文生成に特化した大規模言語モデルで、超長いコンテキストを処理し、首尾一貫した長文内容を生成できます。

モデル特徴

超長テキスト生成

一度に10,000文字以上の首尾一貫した内容を生成できます

長いコンテキスト処理

最大32,768トークンのコンテキストを処理できます

効率的な推論

vllmでデプロイすると、1分以内に10,000文字の内容を生成できます

モデル能力

長文生成

中国語テキスト創作

英語テキスト創作

旅行ガイド作成

長編物語創作

使用事例

コンテンツ創作

旅行ガイド生成

詳細な中国の旅行ガイドを生成します

10,000文字以上の詳細な旅行ガイドを生成できます

長編物語創作

首尾一貫した長編小説や物語を創作します

情節が首尾一貫した長編叙事内容を生成します

専門的なライティング

技術文書作成

詳細な技術文書や説明を生成します

構造が整った長編の技術内容を生成します

🚀 LongWriter-llama3.1-8b

LongWriter-llama3.1-8bは、Meta-Llama-3.1-8Bをベースに訓練されたモデルで、一度に10,000語以上の文章生成が可能です。

📚 [LongWriter Dataset] • 💻 [Github Repo] • 📃 [LongWriter Paper]

🚀 クイックスタート

環境

環境はtransformers>=4.43.0が必要です。

プロンプトテンプレート

プロンプトテンプレートに従ってください（システムプロンプトは任意）: <<SYS>>\n{system prompt}\n<</SYS>>\n\n[INST]{query1}[/INST]{response1}[INST]{query2}[/INST]{response2}...

💻 使用例

基本的な使用法

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("THUDM/LongWriter-llama3.1-8b", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("THUDM/LongWriter-llama3.1-8b", torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto")
model = model.eval()
query = "Write a 10000-word China travel guide"
prompt = f"[INST]{query}[/INST]"
input = tokenizer(prompt, truncation=False, return_tensors="pt").to(device)
context_length = input.input_ids.shape[-1]
output = model.generate(
    **input,
    max_new_tokens=32768,
    num_beams=1,
    do_sample=True,
    temperature=0.5,
)[0]
response = tokenizer.decode(output[context_length:], skip_special_tokens=True)
print(response)

高度な使用法

vllmを使用してモデルをデプロイすることもできます。これにより、1分以内で10,000語以上の文章生成が可能です。以下はサンプルコードです。

model = LLM(
    model= "THUDM/LongWriter-llama3.1-8b",
    dtype="auto",
    trust_remote_code=True,
    tensor_parallel_size=1,
    max_model_len=32768,
    gpu_memory_utilization=0.5,
)
tokenizer = model.get_tokenizer()
generation_params = SamplingParams(
    temperature=0.5,
    top_p=0.8,
    top_k=50,
    max_tokens=32768,
    repetition_penalty=1,
)
query = "Write a 10000-word China travel guide"
prompt = f"[INST]{query}[/INST]"
input_ids = tokenizer(prompt, truncation=False, return_tensors="pt").input_ids[0].tolist()
outputs = model.generate(
    sampling_params=generation_params,
    prompt_token_ids=[input_ids],
)
output = outputs[0]
print(output.outputs[0].text)

📄 ライセンス

このモデルはLlama-3.1 Licenseに基づいています。

📚 詳細ドキュメント

引用

もしこの研究が役に立った場合は、LongWriterを引用していただけると幸いです。

@article{bai2024longwriter,
  title={LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs}, 
  author={Yushi Bai and Jiajie Zhang and Xin Lv and Linzhi Zheng and Siqi Zhu and Lei Hou and Yuxiao Dong and Jie Tang and Juanzi Li},
  journal={arXiv preprint arXiv:2408.07055},
  year={2024}
}