RWKV7 - Goose - World3 - 2.9B - HFオープンソースモデル - 無料で多言語テキスト生成をサポート

ホーム

RWKV7 Goose World3 2.9B HF

RWKVによって開発

RWKV-7モデルはフラッシュ線形アテンションフォーマットを採用し、多言語テキスト生成タスクをサポート、パラメータ数は29億に達します。

大規模言語モデル

Safetensors

複数言語対応オープンソースライセンス:Apache-2.0 #フラッシュ線形アテンション #多言語テキスト生成 #29億パラメータ規模

ダウンロード数 132

リリース時間 : 3/17/2025

モデル概要

これはRWKV-7アーキテクチャに基づく大規模言語モデルで、フラッシュ線形アテンション技術を採用し、中国語を含む複数言語のテキスト生成をサポートします。

モデル特徴

フラッシュ線形アテンション

革新的なフラッシュ線形アテンションフォーマットを採用し、モデル効率を向上

多言語サポート

中国語を含む8言語のテキスト生成をサポート

大規模トレーニング

World v3データセットに基づきトレーニング、総トークン量は3.119兆

モデル能力

多言語テキスト生成

対話システム構築

コンテンツ作成

使用事例

対話システム

インテリジェントアシスタント

多言語インテリジェント対話アシスタントを構築

コンテンツ生成

多言語コンテンツ作成

複数言語のテキストコンテンツを生成

🚀 rwkv7-2.9B-world

このモデルは、flash-linear attention形式のRWKV-7モデルです。自然言語処理タスクにおいて、高い性能を発揮することが期待されます。

🚀 クイックスタート

このモデルを使用する前に、flash-linear-attention <= 0.1.2 と最新バージョンの transformers をインストールしてください。

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

✨ 主な機能

このモデルは、flash-linear attention形式のRWKV-7モデルです。
自然言語処理タスクにおいて、高い性能を発揮することが期待されます。

📦 インストール

このモデルを使用する前に、flash-linear-attention <= 0.1.2 と最新バージョンの transformers をインストールしてください。

pip install --no-use-pep517 flash-linear-attention==0.1.2
pip install 'transformers>=4.48.0'

💻 使用例

基本的な使用法

このモデルは、他のHuggingFaceモデルと同じように使用できます。

from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
model = model.cuda()
prompt = "What is a large language model?"
messages = [
    {"role": "user", "content": "Who are you?"},
    {"role": "assistant", "content": "I am a GPT-3 based model."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=1024,
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=False)[0]
print(response)

📚 ドキュメント

モデルの詳細

モデルの説明

開発者: Bo Peng, Yu Zhang, Songlin Yang, Ruichong Zhang
資金提供: RWKV Project (LF AI & Data Foundation配下)
モデルタイプ: RWKV7
言語: 英語
ライセンス: Apache-2.0
パラメータ数: 29億
トークナイザー: RWKV Worldトークナイザー
語彙サイズ: 65,536

モデルのソース

リポジトリ: https://github.com/fla-org/flash-linear-attention ; https://github.com/BlinkDL/RWKV-LM
論文: RWKV-7 "Goose" with Expressive Dynamic State Evolution