R

RWKV7 Goose Pile 168M HF

由RWKV開發
採用閃存線性注意力格式的RWKV-7模型,基於Pile數據集訓練,支持英語文本生成任務。
下載量 57
發布時間 : 3/17/2025

模型概述

這是一個1.68億參數的RWKV-7模型,採用閃存線性注意力格式,主要用於英語文本生成任務。

模型特點

閃存線性注意力格式
採用閃存線性注意力格式,提高模型效率。
動態狀態演化
支持表達性動態狀態演化,增強模型表現力。
高效訓練
使用bfloat16格式和餘弦衰減學習率進行高效訓練。

模型能力

文本生成
語言建模

使用案例

文本生成
開放域文本生成
生成連貫、有意義的英語文本。
語言理解
語言模型評估
在LAMBADA和PIQA等基準測試中評估語言理解能力。
LAMBADA準確率45.6%,PIQA準確率65.5%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase