RWKV7-1.5B-world開源多語言文本生成模型 - 免費部署輕鬆產出多國語言內容

首頁

Rwkv7 1.5B World

由fla-hub開發

採用閃存線性注意力架構的RWKV-7模型，支持多語言文本生成任務。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #閃存線性注意力 #多語言文本生成 #15億參數規模

下載量 632

發布時間 : 1/28/2025

模型概述

這是一個基於閃存線性注意力架構的RWKV-7模型，主要用於多語言文本生成任務，支持包括中文、英語在內的多種語言。

模型特點

閃存線性注意力架構

採用高效的閃存線性注意力架構，提升模型的計算效率。

多語言支持

支持包括中文、英語在內的8種語言，適用於多語言文本生成任務。

大規模訓練數據

基於World v3數據集訓練，總token量達3.119萬億，模型性能優越。

模型能力

多語言文本生成

對話生成

內容創作

使用案例

對話系統

智能客服

用於構建多語言智能客服系統，自動回答用戶問題。

內容生成

多語言文章生成

生成多語言的文章、新聞或故事內容。

🚀 rwkv7-1.5B-world

這是一款基於flash-linear attention格式的RWKV-7模型，支持多種語言，可用於文本生成任務，在自然語言處理領域有廣泛應用。

🚀 快速開始

在使用該模型之前，需要安裝flash-linear-attention和最新版本的transformers：

pip install git+https://github.com/fla-org/flash-linear-attention
pip install 'transformers>=4.48.0'

✨ 主要特性

多語言支持：支持英語、中文、日語、韓語、法語、阿拉伯語、西班牙語和葡萄牙語。
模型類型：RWKV7
許可證：Apache-2.0

📦 安裝指南

安裝flash-linear-attention和最新版本的transformers：

pip install git+https://github.com/fla-org/flash-linear-attention
pip install 'transformers>=4.48.0'

💻 使用示例

基礎用法

你可以像使用其他HuggingFace模型一樣使用該模型：

from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-1.5B-world', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-1.5B-world', trust_remote_code=True)

model = model.cuda() # Supported on Nvidia/AMD/Intel eg. model.xpu()
prompt = "What is a large language model?"
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=4096,
    do_sample=True,
    temperature=1.0,
    top_p=0.3,
    repetition_penalty=1.2
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=False)[0]
print(response)