RWKV-Raven-14B開源大語言模型 - 高效訓練推理，支持無限上下文處理

首頁

Rwkv Raven 14b

由RWKV開發

RWKV是一種結合RNN和Transformer優勢的大語言模型，支持高效訓練和快速推理，具備無限上下文處理能力。

大型語言模型

Transformers

#長文本處理 #RNN-Transformer混合架構 #中文對話生成

下載量 271

發布時間 : 5/5/2023

模型概述

RWKV-4 Raven是一個140億參數的大語言模型，採用獨特的RNN-Transformer混合架構，專為聊天和文本生成任務優化。

模型特點

高效架構

結合RNN和Transformer優勢，支持並行化訓練同時保持RNN的推理效率

長上下文處理

理論上支持無限長度的上下文處理

資源高效

相比傳統Transformer模型更節省顯存和計算資源

模型能力

中文文本生成

對話系統構建

長文本處理

創意寫作

使用案例

對話系統

智能聊天機器人

構建能進行自然流暢對話的中文聊天機器人

內容創作

故事生成

根據提示生成連貫的長篇故事內容

🚀 RWKV-4 | 14B參數聊天版本（Raven）模型卡片

RWKV是由Bo Peng領導的項目。您可以在Johan Wind的博客文章此處和此處瞭解更多關於模型架構的信息。您還可以加入RWKV Discord服務器來深入瞭解該項目。

TL;DR

以下是來自原始倉庫的描述：

RWKV是一種具有Transformer級大型語言模型性能的循環神經網絡（RNN）。它可以像GPT一樣直接進行訓練（可並行化）。它結合了RNN和Transformer的優點——性能出色、推理速度快、節省顯存、訓練速度快、具有“無限”上下文長度，並且能免費獲取句子嵌入。

✨ 主要特性

模型詳情

模型架構的詳細信息可在上述博客文章以及Hugging Face關於集成的博客文章中找到。

📦 安裝指南

將原始權重轉換為Hugging Face格式

您可以使用convert_rwkv_checkpoint_to_hf.py腳本，通過指定原始權重的倉庫ID、文件名和輸出目錄來進行轉換。您還可以選擇通過傳遞--push_to_hub標誌和--model_name參數，將轉換後的模型直接推送到Hugging Face Hub，以指定推送轉換後權重的位置。

python convert_rwkv_checkpoint_to_hf.py --repo_id RAW_HUB_REPO --checkpoint_file RAW_FILE --output_dir OUTPUT_DIR --push_to_hub --model_name dummy_user/converted-rwkv

💻 使用示例

生成文本

您可以使用AutoModelForCausalLM和AutoTokenizer類從模型生成文本。展開以下部分，瞭解如何在不同場景下運行模型： “Raven”模型需要以特定方式進行提示，您可以在集成博客文章中瞭解更多相關信息。

基礎用法

在CPU上運行模型

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-raven-14b")
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-raven-14b")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt")
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))

高級用法

在單個GPU上運行模型

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-raven-14b").to(0)
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-raven-14b")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt").to(0)
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))

在GPU上以半精度運行模型

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-raven-14b", torch_dtype=torch.float16).to(0)
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-raven-14b")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt").to(0)
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))

在多個GPU上運行模型

# pip install accelerate
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-raven-14b", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-raven-14b")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt").to(0)
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))