RWKV-4-169m-pile開源大語言模型 - 集RNN與Transformer優勢，快速推理訓練

首頁

Rwkv 4 169m Pile

由RWKV開發

RWKV-4是一種融合RNN與Transformer優勢的大語言模型，具備高性能、快速推理和高效訓練特點

大型語言模型

Transformers

#RNN-Transformer混合架構 #高效長文本處理 #中文語言生成

下載量 5,698

發布時間 : 5/4/2023

模型概述

RWKV-4是一種創新的語言模型架構，結合了RNN的高效性和Transformer的強大性能，支持無限上下文長度和免費句子嵌入

模型特點

RNN與Transformer融合

結合RNN的高效序列處理和Transformer的並行訓練優勢

高效推理

相比傳統Transformer模型具有更快的推理速度和更低的顯存需求

無限上下文長度

得益於RNN架構特性，理論上支持無限長度的上下文處理

免費句子嵌入

可免費獲取高質量的句子級別嵌入表示

模型能力

文本生成

語言建模

句子嵌入提取

使用案例

內容創作

故事續寫

根據給定開頭自動生成連貫的故事內容

示例中展示了流暢的中文故事續寫能力

對話系統

聊天機器人

構建流暢的對話交互系統

🚀 RWKV-4 | 基於Pile數據集訓練的1.69億參數模型卡片

RWKV是一個由Bo Peng領導的項目。你可以通過Johan Wind的博客文章這裡和這裡瞭解更多關於該模型架構的信息。你還可以通過加入RWKV Discord服務器來深入瞭解這個項目。

🚀 快速開始

模型簡述

以下是來自原倉庫的描述：

RWKV是一種具有Transformer級大語言模型性能的循環神經網絡（RNN）。它可以像GPT一樣直接進行訓練（可並行化）。它結合了RNN和Transformer的優點——性能出色、推理速度快、節省顯存、訓練速度快、具有“無限”上下文長度，並且能免費獲得句子嵌入。

✨ 主要特性

數據集：使用了EleutherAI/pile數據集進行訓練。

📚 詳細文檔

模型細節

模型架構的詳細信息可以在上述博客文章以及Hugging Face關於該模型集成的博客文章中找到。

模型使用

將原始權重轉換為Hugging Face格式

你可以使用convert_rwkv_checkpoint_to_hf.py腳本，通過指定原始權重的倉庫ID、文件名和輸出目錄來進行轉換。你還可以選擇通過傳遞--push_to_hub標誌和--model_name參數，將轉換後的模型直接推送到Hugging Face Hub上。

python convert_rwkv_checkpoint_to_hf.py --repo_id RAW_HUB_REPO --checkpoint_file RAW_FILE --output_dir OUTPUT_DIR --push_to_hub --model_name dummy_user/converted-rwkv

文本生成

你可以使用AutoModelForCausalLM和AutoTokenizer類從模型中生成文本。展開以下部分，瞭解如何在不同場景下運行該模型：

💻 使用示例

基礎用法

在CPU上運行模型

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-4-169m-pile")
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-4-169m-pile")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt")
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))

高級用法

在單個GPU上運行模型

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-4-169m-pile").to(0)
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-4-169m-pile")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt").to(0)
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))

在GPU上以半精度運行模型

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-4-169m-pile", torch_dtype=torch.float16).to(0)
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-4-169m-pile")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt").to(0)
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))

在多個GPU上運行模型

# pip install accelerate
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("RWKV/rwkv-4-169m-pile", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("RWKV/rwkv-4-169m-pile")

prompt = "\nIn a shocking finding, scientist discovered a herd of dragons living in a remote, previously unexplored valley, in Tibet. Even more surprising to the researchers was the fact that the dragons spoke perfect Chinese."

inputs = tokenizer(prompt, return_tensors="pt").to(0)
output = model.generate(inputs["input_ids"], max_new_tokens=40)
print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))