GPT-J-6B-Janeway開源語言模型 - 拓展多題材，助力科幻奇幻創作

首頁

GPT J 6B Janeway

由KoboldAI開發

基於GPT-J 6B微調的科幻奇幻題材語言模型，擴展了20%多題材內容

大型語言模型

Transformers

英語開源協議:MIT #科幻奇幻文本生成 #多體裁適配 #長文本連貫性

下載量 3,175

發布時間 : 3/2/2022

模型概述

專注於科幻與奇幻題材文本生成的自迴歸語言模型，是GPT-J-6B的微調版本

模型特點

題材增強

針對科幻與奇幻題材進行專項優化，生成內容更符合類型文學特徵

多標籤支持

支持通過[體裁:標籤]前綴控制生成內容的風格傾向

內容擴展

在原始數據集基礎上增加了20%的多題材訓練內容

模型能力

開放域文本生成

風格化文本創作

對話模擬

故事續寫

使用案例

創意寫作

科幻小說輔助創作

根據提示生成符合科幻設定的段落或情節

生成具有太空歌劇風格的連貫文本

角色對話模擬

模擬特定角色（如艦長）的對話風格

生成符合角色設定的自然對話

娛樂應用

互動故事遊戲

作為遊戲引擎的敘事生成組件

🚀 GPT-J 6B - Janeway

GPT-J 6B - Janeway是基於EleutherAI的GPT-J 6B模型微調而來的模型，使用約2210本電子書進行訓練，主要涵蓋科幻和奇幻等類型，能用於文本生成，但使用時需注意其侷限性和偏差。

🚀 快速開始

你可以直接使用文本生成管道來使用這個模型。以下示例每次運行時都會生成不同的序列：

>>> from transformers import pipeline
>>> generator = pipeline('text-generation', model='KoboldAI/GPT-J-6B-Janeway')
>>> generator("Welcome Captain Janeway, I apologize for the delay.", do_sample=True, min_length=50)
[{'generated_text': 'Welcome Captain Janeway, I apologize for the delay."\nIt's all right," Janeway said. "I'm certain that you're doing your best to keep me informed of what\'s going on."'}]

✨ 主要特性

基於EleutherAI的GPT-J 6B模型進行微調。
訓練數據包含約2210本電子書，主要為科幻和奇幻類型。
數據集基於GPT-Neo-2.7B - Picard使用的數據集，各類型數據增加了20%。

📚 詳細文檔

模型描述

GPT-J 6B - Janeway是使用EleutherAI的GPT-J 6B模型創建的微調模型。

訓練數據

訓練數據包含約2210本電子書，大多屬於科幻和奇幻類型。該數據集基於GPT - Neo - 2.7B - Picard使用的同一數據集，各類型數據增加了20%。數據集的某些部分已使用以下文本作為前綴：[Genre: <genre1>,<genre2>]

侷限性和偏差

GPT - J的核心功能是獲取一段文本字符串並預測下一個標記。雖然語言模型廣泛用於此之外的任務，但這項工作仍有很多未知因素。在提示GPT - J時，重要的是要記住，統計上最可能的下一個標記通常不是產生最“準確”文本的標記。絕不要依賴GPT - J來產生事實準確的輸出。

GPT - J是在Pile數據集上訓練的，該數據集已知包含褻瀆、淫穢和其他冒犯性語言。根據用例的不同，GPT - J可能會產生社會不可接受的文本。有關Pile數據集中偏差的更詳細分析，請參閱Pile論文的第5和6節。

與所有語言模型一樣，很難提前預測GPT - J會如何響應特定提示，並且可能會在沒有警告的情況下出現冒犯性內容。我們建議在發佈輸出之前由人工對其進行篩選或過濾，以審查不良內容並提高結果的質量。

BibTeX引用和引用信息

該模型使用以下模型作為基礎：

@misc{gpt-j,
  author = {Wang, Ben and Komatsuzaki, Aran},
  title = {{GPT-J-6B: A 6 Billion Parameter Autoregressive Language Model}},
  howpublished = {\url{https://github.com/kingoflolz/mesh-transformer-jax}},
  year = 2021,
  month = May
}