RWKV7-1.5B-world开源多语言文本生成模型 - 免费部署轻松产出多国语言内容

首页

Rwkv7 1.5B World

由 fla-hub 开发

采用闪存线性注意力架构的RWKV-7模型，支持多语言文本生成任务。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #闪存线性注意力 #多语言文本生成 #15亿参数规模

下载量 632

发布时间 : 1/28/2025

模型简介

这是一个基于闪存线性注意力架构的RWKV-7模型，主要用于多语言文本生成任务，支持包括中文、英语在内的多种语言。

模型特点

闪存线性注意力架构

采用高效的闪存线性注意力架构，提升模型的计算效率。

多语言支持

支持包括中文、英语在内的8种语言，适用于多语言文本生成任务。

大规模训练数据

基于World v3数据集训练，总token量达3.119万亿，模型性能优越。

模型能力

多语言文本生成

对话生成

内容创作

使用案例

对话系统

智能客服

用于构建多语言智能客服系统，自动回答用户问题。

内容生成

多语言文章生成

生成多语言的文章、新闻或故事内容。

🚀 rwkv7-1.5B-world

这是一款基于flash-linear attention格式的RWKV-7模型，支持多种语言，可用于文本生成任务，在自然语言处理领域有广泛应用。

🚀 快速开始

在使用该模型之前，需要安装flash-linear-attention和最新版本的transformers：

pip install git+https://github.com/fla-org/flash-linear-attention
pip install 'transformers>=4.48.0'

✨ 主要特性

多语言支持：支持英语、中文、日语、韩语、法语、阿拉伯语、西班牙语和葡萄牙语。
模型类型：RWKV7
许可证：Apache-2.0

📦 安装指南

安装flash-linear-attention和最新版本的transformers：

pip install git+https://github.com/fla-org/flash-linear-attention
pip install 'transformers>=4.48.0'

💻 使用示例

基础用法

你可以像使用其他HuggingFace模型一样使用该模型：

from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-1.5B-world', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-1.5B-world', trust_remote_code=True)

model = model.cuda() # Supported on Nvidia/AMD/Intel eg. model.xpu()
prompt = "What is a large language model?"
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=4096,
    do_sample=True,
    temperature=1.0,
    top_p=0.3,
    repetition_penalty=1.2
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=False)[0]
print(response)