fairseq - dense - 13B - Janeway開源模型 - 免費生成科幻與奇幻類精彩文本

首頁

Fairseq Dense 13B Janeway

由KoboldAI開發

基於Fairseq混合專家密集模型微調而成的版本，主要用於科幻與奇幻類文本生成

大型語言模型

Transformers

英語開源協議:MIT #科幻文本生成 #混合專家架構 #電子書風格微調

下載量 1,287

發布時間 : 4/6/2022

模型概述

該模型是基於Fairseq混合專家密集架構微調的大規模語言模型，專注於科幻與奇幻類文本生成任務

模型特點

科幻奇幻文本優化

專門針對科幻與奇幻類文本進行微調，生成內容更符合該題材特點

數據標註格式

訓練數據採用特定格式標註，如[體裁：<體裁1>,<體裁2>]，有助於控制生成內容風格

大規模參數

13B參數規模提供較強的語言理解和生成能力

模型能力

文本生成

風格化寫作

科幻奇幻內容創作

使用案例

創意寫作

科幻小說創作

生成符合科幻風格的連貫文本段落

可生成符合科幻設定的自然語言文本

奇幻故事生成

基於提示生成奇幻題材的故事情節

產生具有奇幻元素的連貫敘事

對話系統

角色對話模擬

模擬科幻作品中的人物對話風格

生成符合角色設定的自然對話

🚀 Fairseq-dense 13B - Janeway

Fairseq-dense 13B - Janeway是使用Fairseq的MoE密集模型創建的微調模型，可用於文本生成等自然語言處理任務。

🚀 快速開始

你可以直接使用文本生成管道來使用此模型。以下示例每次運行時都會生成不同的序列：

>>> from transformers import pipeline
>>> generator = pipeline('text-generation', model='KoboldAI/fairseq-dense-13B-Janeway')
>>> generator("Welcome Captain Janeway, I apologize for the delay.", do_sample=True, min_length=50)
[{'generated_text': 'Welcome Captain Janeway, I apologize for the delay."\nIt's all right," Janeway said. "I'm certain that you're doing your best to keep me informed of what\'s going on."'}]

✨ 主要特性

Fairseq-dense 13B - Janeway 基於 Fairseq 的 MoE 密集模型進行微調，具有以下特點：

利用大量電子書數據進行訓練，在科幻和奇幻等特定領域可能表現出色。
可直接通過文本生成管道使用，方便快捷。

📦 安裝指南

文檔未提及安裝步驟，如需使用該模型，可參考 transformers 庫的安裝與使用說明。

💻 使用示例

基礎用法

>>> from transformers import pipeline
>>> generator = pipeline('text-generation', model='KoboldAI/fairseq-dense-13B-Janeway')
>>> generator("Welcome Captain Janeway, I apologize for the delay.", do_sample=True, min_length=50)
[{'generated_text': 'Welcome Captain Janeway, I apologize for the delay."\nIt's all right," Janeway said. "I'm certain that you're doing your best to keep me informed of what\'s going on."'}]

📚 詳細文檔

模型描述

Fairseq-dense 13B - Janeway 是使用 Fairseq 的 MoE 密集模型創建的微調模型。

訓練數據

訓練數據包含約 2210 本電子書，主要是科幻和奇幻類型。該數據集與 GPT-Neo-2.7B - Janeway 使用的數據集相同。數據集的某些部分已使用以下文本作為前綴：[Genre: <genre1>,<genre2>]

侷限性和偏差

基於 NLP 技術已知的問題，潛在的相關因素包括偏差（性別、職業、種族和宗教）。

BibTeX 引用和引用信息

Artetxe et al. (2021): Efficient Large Scale Language Modeling with Mixtures of Experts

📄 許可證

本項目採用 MIT 許可證。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫