StrangeMerges_17-7B-dare_tiesオープンソースAIモデル - 優位性を融合した全く新しいアプリケーション体験をもたらす

Strangemerges 17 7B Dare Ties

Gilleによって開発

StrangeMerges_17-7B-dare_tiesは、LazyMergekitを使用してGille/StrangeMerges_16-7B-slerpとGille/StrangeMerges_12-7B-slerpの2つのモデルをdare_tiesマージ手法で統合したものです。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #マルチタスクテキスト生成 #高精度推論 #DARE-TIESマージ

ダウンロード数 20

リリース時間 : 1/31/2024

モデル概要

これは70億パラメータ規模の大規模言語モデルで、主にテキスト生成タスクに使用され、オープンLLMリーダーボードで良好なパフォーマンスを示しています。

モデル特徴

モデルマージ技術

dare_ties手法を使用して2つのモデルをマージし、パラメータ密度と重み配分を最適化しました

高性能

オープンLLMリーダーボードで平均スコア69.54を達成し、優れたパフォーマンスを示しています

柔軟な応用

様々なテキスト生成タスクをサポートし、必要に応じて生成パラメータを調整できます

モデル能力

テキスト生成

質問応答システム

知識推論

使用事例

教育

知識質問応答

様々な知識質問に回答します

AI2推論チャレンジで66.64の正規化精度を達成

研究

言語モデル研究

モデルマージ技術と性能評価の研究に使用されます

🚀 StrangeMerges_17-7B-dare_ties

StrangeMerges_17-7B-dare_tiesは、LazyMergekitを使用して以下のモデルをマージしたものです。

✨ 主な機能

このモデルは、複数のモデルをマージすることで、テキスト生成タスクにおいて良好な性能を発揮します。

📦 インストール

使用するには、必要なライブラリをインストールする必要があります。以下のコマンドを実行してください。

!pip install -qU transformers accelerate

💻 使用例

基本的な使用法

from transformers import AutoTokenizer
import transformers
import torch

model = "Gille/StrangeMerges_17-7B-dare_ties"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

📚 ドキュメント

🧩 設定

models:
  - model: Gille/StrangeMerges_16-7B-slerp
    # no parameters necessary for base model
  - model: Gille/StrangeMerges_16-7B-slerp
    parameters:
      density: 0.5
      weight: 0.4
  - model: Gille/StrangeMerges_12-7B-slerp
    parameters:
      density: 0.5
      weight: 0.6
merge_method: dare_ties
base_model: Gille/StrangeMerges_16-7B-slerp
parameters:
  normalize: true
dtype: float16

Open LLM Leaderboard評価結果

詳細な結果はこちらで確認できます。

メトリック	値
平均	69.54
AI2 Reasoning Challenge (25-Shot)	66.64
HellaSwag (10-Shot)	86.04
MMLU (5-Shot)	65.07
TruthfulQA (0-shot)	53.18
Winogrande (5-shot)	81.93
GSM8k (5-shot)	64.37