qwen1.5-moe-tiny-randomオープンソーステキスト生成モデル - 各種のテキスト創作タスクに無料で使用可能

ホーム

Qwen1.5 Moe Tiny Random

yujiepanによって開発

これはQwen1.5-MoEアーキテクチャに基づくランダム初期化の小型モデルで、float16精度を採用し、テキスト生成タスクに適しています。

大規模言語モデル

Transformers

#小規模MoEアーキテクチャ #float16精度 #スライディングウィンドウアテンション

ダウンロード数 30

リリース時間 : 3/30/2024

モデル概要

このモデルはQwen/Qwen1.5-MoE-A2.7B-Chatの設定に基づくが、より小規模なランダム初期化バージョンで、主にテキスト生成タスクに使用されます。

モデル特徴

小型化設計

Qwen1.5-MoEアーキテクチャに基づきながらも規模を縮小し、リソースが限られた環境に適しています。

float16精度

float16精度を採用し、計算効率とモデル性能のバランスを取っています。

スライディングウィンドウサポート

長文処理を最適化するため、スライディングウィンドウ(max_window_layers=1)が設定されています。

モデル能力

テキスト生成

対話システム

使用事例

対話システム

簡単な対話

シンプルなチャットボットの構築に使用可能

テキスト生成

短文生成

短いテキストコンテンツを生成

## 🚀 トランスフォーマーライブラリ

このライブラリはテキスト生成を行うためのもので、推論機能を備えています。

## 🚀 クイックスタート

このモデルはランダムに初期化されており、[Qwen/Qwen1.5 - MoE - A2.7B - Chat](https://huggingface.co/Qwen/Qwen1.5-MoE-A2.7B-Chat/blob/main/config.json) の設定を使用していますが、サイズはより小さくなっています。なお、このモデルはfloat16形式です。

## 💻 使用例

### 基本的な使用法
```python
import transformers
import torch
import os
from huggingface_hub import create_repo, upload_folder

source_model_id = 'Qwen/Qwen1.5-MoE-A2.7B-Chat'
save_path = '/tmp/yujiepan/qwen1.5-moe-tiny-random'
repo_id = 'yujiepan/qwen1.5-moe-tiny-random'

config = transformers.AutoConfig.from_pretrained(
    source_model_id, trust_remote_code=True)
config.hidden_size = 4
config.intermediate_size = 2
config.num_attention_heads = 4
config.num_hidden_layers = 2
config.num_key_value_heads = 2
config.moe_intermediate_size = 2
config.shared_expert_intermediate_size = 2
config.max_window_layers = 1
config.use_sliding_window = True
config.torch_dtype = torch.float16

model = transformers.AutoModelForCausalLM.from_config(
    config, trust_remote_code=True, torch_dtype=torch.float16)
model = model.half()

tokenizer = transformers.AutoTokenizer.from_pretrained(
    source_model_id, trust_remote_code=True)

result = transformers.pipelines.pipeline(
    'text-generation',
    model=model, tokenizer=tokenizer,
    device=0,
    max_new_tokens=16,
)('Hello World!')
print(result)

model.save_pretrained(save_path)
tokenizer.save_pretrained(save_path)

os.system(f'ls -alh {save_path}')
create_repo(repo_id, exist_ok=True)
upload_folder(repo_id=repo_id, folder_path=save_path)