RWKV7-Goose-Pile-168M-HF開源模型 - 支持英語文本生成的免費實用工具

首頁

RWKV7 Goose Pile 168M HF

由RWKV開發

採用閃存線性注意力格式的RWKV-7模型，基於Pile數據集訓練，支持英語文本生成任務。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #閃存線性注意力 #英語文本生成 #動態狀態演化

下載量 57

發布時間 : 3/17/2025

模型概述

這是一個1.68億參數的RWKV-7模型，採用閃存線性注意力格式，主要用於英語文本生成任務。

模型特點

閃存線性注意力格式

採用閃存線性注意力格式，提高模型效率。

動態狀態演化

支持表達性動態狀態演化，增強模型表現力。

高效訓練

使用bfloat16格式和餘弦衰減學習率進行高效訓練。

模型能力

文本生成

語言建模

使用案例

文本生成

開放域文本生成

生成連貫、有意義的英語文本。

語言理解

語言模型評估

在LAMBADA和PIQA等基準測試中評估語言理解能力。

LAMBADA準確率45.6%，PIQA準確率65.5%

🚀 rwkv7-168M-pile

這是一個基於flash-linear注意力格式的RWKV-7模型，可用於文本生成任務，為英文文本處理提供支持。

🚀 快速開始

在使用此模型之前，需要安裝 flash-linear-attention（版本 <= 0.1.2）和最新版本的 transformers：

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

✨ 主要特性

基於RWKV-7架構，採用flash-linear注意力格式。
支持英文文本生成任務。
擁有168M參數，使用GPT-NeoX 20B分詞器。

📦 安裝指南

安裝 flash-linear-attention <= 0.1.2 和最新版本的 transformers：

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

💻 使用示例

基礎用法

你可以像使用其他HuggingFace模型一樣使用此模型：

from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-168M-pile', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-168M-pile', trust_remote_code=True)

📚 詳細文檔

模型詳情

模型描述

開發者：Bo Peng, Yu Zhang, Songlin Yang, Ruichong Zhang
資助方：RWKV項目（隸屬於LF AI & Data基金會）
模型類型：RWKV7
語言（NLP）：英文
許可證：Apache-2.0
參數數量：168M
分詞器：GPT-NeoX 20B分詞器

模型來源

倉庫：https://github.com/fla-org/flash-linear-attention ; https://github.com/BlinkDL/RWKV-LM
論文：RWKV-7 "Goose" with Expressive Dynamic State Evolution
權重：從 https://modelscope.cn/models/RWKV/rwkv-7-pile/file/view/master?fileName=RWKV-x070-Pile-168M-20241120-ctx4096.pth 轉換而來