RWKV7-Goose-World3-2.9B-HF开源模型 - 免费支持多语言文本生成

首页

RWKV7 Goose World3 2.9B HF

由 RWKV 开发

RWKV-7模型采用闪存线性注意力格式，支持多语言文本生成任务，参数量达29亿。

大型语言模型

Safetensors

支持多种语言开源协议:Apache-2.0 #闪存线性注意力 #多语言文本生成 #29亿参数规模

下载量 132

发布时间 : 3/17/2025

模型简介

这是一个基于RWKV-7架构的大语言模型，采用闪存线性注意力技术，支持包括中文在内的多种语言文本生成。

模型特点

闪存线性注意力

采用创新的闪存线性注意力格式，提高模型效率

多语言支持

支持包括中文在内的8种语言的文本生成

大规模训练

基于World v3数据集训练，总token量达3.119万亿

模型能力

多语言文本生成

对话系统构建

内容创作

使用案例

对话系统

智能助手

构建多语言智能对话助手

内容生成

多语言内容创作

生成多种语言的文本内容

🚀 rwkv7-2.9B-world

这是一个采用闪存线性注意力格式的RWKV - 7模型，可用于文本生成任务。

🚀 快速开始

在使用此模型之前，请安装flash-linear-attention <= 0.1.2和最新版本的transformers：

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

✨ 主要特性

支持多种语言，包括英语、中文、日语、韩语、法语、阿拉伯语、西班牙语和葡萄牙语。
采用闪存线性注意力格式，提升性能。
可用于文本生成任务。

📦 安装指南

在使用此模型之前，请安装flash-linear-attention <= 0.1.2和最新版本的transformers：

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

💻 使用示例

基础用法

你可以像使用其他HuggingFace模型一样使用此模型：

from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
model = model.cuda()
prompt = "What is a large language model?"
messages = [
    {"role": "user", "content": "Who are you?"},
    {"role": "assistant", "content": "I am a GPT-3 based model."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=1024,
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=False)[0]
print(response)

📚 详细文档

模型详情

模型描述

开发者：Bo Peng、Yu Zhang、Songlin Yang、Ruichong Zhang
资助方：RWKV项目（隶属于LF AI & Data基金会）
模型类型：RWKV7
支持语言（NLP）：英语
许可证：Apache - 2.0
参数数量：29亿
分词器：RWKV World分词器
词汇表大小：65,536

模型来源

仓库：https://github.com/fla-org/flash-linear-attention ; https://github.com/BlinkDL/RWKV - LM
论文：RWKV - 7 "Goose" with Expressive Dynamic State Evolution