RWKV7-Goose-World3-2.9B-HF開源模型 - 免費支持多語言文本生成

首頁

RWKV7 Goose World3 2.9B HF

由RWKV開發

RWKV-7模型採用閃存線性注意力格式，支持多語言文本生成任務，參數量達29億。

大型語言模型

Safetensors

支持多種語言開源協議:Apache-2.0 #閃存線性注意力 #多語言文本生成 #29億參數規模

下載量 132

發布時間 : 3/17/2025

模型概述

這是一個基於RWKV-7架構的大語言模型，採用閃存線性注意力技術，支持包括中文在內的多種語言文本生成。

模型特點

閃存線性注意力

採用創新的閃存線性注意力格式，提高模型效率

多語言支持

支持包括中文在內的8種語言的文本生成

大規模訓練

基於World v3數據集訓練，總token量達3.119萬億

模型能力

多語言文本生成

對話系統構建

內容創作

使用案例

對話系統

智能助手

構建多語言智能對話助手

內容生成

多語言內容創作

生成多種語言的文本內容

🚀 rwkv7-2.9B-world

這是一個採用閃存線性注意力格式的RWKV - 7模型，可用於文本生成任務。

🚀 快速開始

在使用此模型之前，請安裝flash-linear-attention <= 0.1.2和最新版本的transformers：

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

✨ 主要特性

支持多種語言，包括英語、中文、日語、韓語、法語、阿拉伯語、西班牙語和葡萄牙語。
採用閃存線性注意力格式，提升性能。
可用於文本生成任務。

📦 安裝指南

在使用此模型之前，請安裝flash-linear-attention <= 0.1.2和最新版本的transformers：

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

💻 使用示例

基礎用法

你可以像使用其他HuggingFace模型一樣使用此模型：

from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
model = model.cuda()
prompt = "What is a large language model?"
messages = [
    {"role": "user", "content": "Who are you?"},
    {"role": "assistant", "content": "I am a GPT-3 based model."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=1024,
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=False)[0]
print(response)

📚 詳細文檔

模型詳情

模型描述

開發者：Bo Peng、Yu Zhang、Songlin Yang、Ruichong Zhang
資助方：RWKV項目（隸屬於LF AI & Data基金會）
模型類型：RWKV7
支持語言（NLP）：英語
許可證：Apache - 2.0
參數數量：29億
分詞器：RWKV World分詞器
詞彙表大小：65,536

模型來源

倉庫：https://github.com/fla-org/flash-linear-attention ; https://github.com/BlinkDL/RWKV - LM
論文：RWKV - 7 "Goose" with Expressive Dynamic State Evolution