fairseq - dense - 13B - Janeway开源模型 - 免费生成科幻与奇幻类精彩文本

首页

Fairseq Dense 13B Janeway

由 KoboldAI 开发

基于Fairseq混合专家密集模型微调而成的版本，主要用于科幻与奇幻类文本生成

大型语言模型

Transformers

英语开源协议:MIT #科幻文本生成 #混合专家架构 #电子书风格微调

下载量 1,287

发布时间 : 4/6/2022

模型简介

该模型是基于Fairseq混合专家密集架构微调的大规模语言模型，专注于科幻与奇幻类文本生成任务

模型特点

科幻奇幻文本优化

专门针对科幻与奇幻类文本进行微调，生成内容更符合该题材特点

数据标注格式

训练数据采用特定格式标注，如[体裁：<体裁1>,<体裁2>]，有助于控制生成内容风格

大规模参数

13B参数规模提供较强的语言理解和生成能力

模型能力

文本生成

风格化写作

科幻奇幻内容创作

使用案例

创意写作

科幻小说创作

生成符合科幻风格的连贯文本段落

可生成符合科幻设定的自然语言文本

奇幻故事生成

基于提示生成奇幻题材的故事情节

产生具有奇幻元素的连贯叙事

对话系统

角色对话模拟

模拟科幻作品中的人物对话风格

生成符合角色设定的自然对话

🚀 Fairseq-dense 13B - Janeway

Fairseq-dense 13B - Janeway是使用Fairseq的MoE密集模型创建的微调模型，可用于文本生成等自然语言处理任务。

🚀 快速开始

你可以直接使用文本生成管道来使用此模型。以下示例每次运行时都会生成不同的序列：

>>> from transformers import pipeline
>>> generator = pipeline('text-generation', model='KoboldAI/fairseq-dense-13B-Janeway')
>>> generator("Welcome Captain Janeway, I apologize for the delay.", do_sample=True, min_length=50)
[{'generated_text': 'Welcome Captain Janeway, I apologize for the delay."\nIt's all right," Janeway said. "I'm certain that you're doing your best to keep me informed of what\'s going on."'}]

✨ 主要特性

Fairseq-dense 13B - Janeway 基于 Fairseq 的 MoE 密集模型进行微调，具有以下特点：

利用大量电子书数据进行训练，在科幻和奇幻等特定领域可能表现出色。
可直接通过文本生成管道使用，方便快捷。

📦 安装指南

文档未提及安装步骤，如需使用该模型，可参考 transformers 库的安装与使用说明。

💻 使用示例

基础用法

>>> from transformers import pipeline
>>> generator = pipeline('text-generation', model='KoboldAI/fairseq-dense-13B-Janeway')
>>> generator("Welcome Captain Janeway, I apologize for the delay.", do_sample=True, min_length=50)
[{'generated_text': 'Welcome Captain Janeway, I apologize for the delay."\nIt's all right," Janeway said. "I'm certain that you're doing your best to keep me informed of what\'s going on."'}]

📚 详细文档

模型描述

Fairseq-dense 13B - Janeway 是使用 Fairseq 的 MoE 密集模型创建的微调模型。

训练数据

训练数据包含约 2210 本电子书，主要是科幻和奇幻类型。该数据集与 GPT-Neo-2.7B - Janeway 使用的数据集相同。数据集的某些部分已使用以下文本作为前缀：[Genre: <genre1>,<genre2>]

局限性和偏差

基于 NLP 技术已知的问题，潜在的相关因素包括偏差（性别、职业、种族和宗教）。

BibTeX 引用和引用信息

Artetxe et al. (2021): Efficient Large Scale Language Modeling with Mixtures of Experts

📄 许可证

本项目采用 MIT 许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库