supermario-slerp-v2オープンソーステキスト生成モデル - SLERPによるマージで、複数のベンチマークテストで優れた性能を発揮

ホーム

Supermario Slerp V2

jan-hqによって開発

supermario-slerp-v2は、SLERP手法を用いて2つの7Bパラメータモデルを統合したテキスト生成モデルで、複数のベンチマークテストで優れた性能を発揮します。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #マルチタスクテキスト生成 #高精度推論 #知識集約型QA

ダウンロード数 15

リリース時間 : 12/12/2023

モデル概要

このモデルはSLERP手法によりv1olet_marcoroni-go-bruins-merge-7Bとjuanako-7b-UNAの2モデルを統合したもので、主にテキスト生成タスクに使用されます。

モデル特徴

モデル統合技術

SLERP手法で異なる2モデルを統合し、それぞれの強みを組み合わせる

高性能

HellaSwagで86.6の標準化精度達成など、複数ベンチマークで優れた結果

オープンソース利用可能

Apache 2.0ライセンスで自由に利用・改変可能

モデル能力

テキスト生成

QAシステム

推論タスク

使用事例

教育

AI2推論チャレンジ

複雑な推論問題の解決に使用

標準化精度69.37

常識推論

HellaSwagテスト

モデルの常識推論能力を評価

標準化精度86.6

数学問題解決

GSM8k数学テスト

小学校レベルの数学問題を解決

精度63.46

🚀 スーパーマリオ-SLERP-v2

このモデルはテキスト生成タスクに特化しており、特定のマージ方法を用いて構築されています。多様なデータセットで評価され、良好な結果を示しています。また、Jan Desktopを使って簡単に実行することができます。

🚀 クイックスタート

このモデルは、Jan Desktopを使用してMac、Windows、またはLinuxで実行することができます。

JanはオープンソースのChatGPT代替品で、以下の特徴を持っています。

💻 マシン上で100%オフライン：会話内容は機密性が保たれ、あなただけが閲覧できます。
🗂️ オープンファイル形式：会話とモデル設定はあなたのコンピュータ上に保存され、いつでもエクスポートまたは削除できます。
🌐 OpenAI互換：ポート1337のローカルサーバーでOpenAI互換のエンドポイントを提供します。
🌍 オープンソースかつ無料：私たちはオープンで開発を行っています。Githubをチェックしてください。

image/png

✨ 主な機能

モデル構築

このモデルは2つのモデルからSlerpマージ方法を使用しています。

ベースモデル: v1olet_marcoroni-go-bruins-merge-7B

モデルのyaml設定ファイルは以下の通りです。

slices:
  - sources:
      - model: v1olet/v1olet_marcoroni-go-bruins-merge-7B
        layer_range: [0, 32]
      - model: fblgit/juanako-7b-UNA
        layer_range: [0, 32]
merge_method: slerp
base_model: v1olet/v1olet_marcoroni-go-bruins-merge-7B
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: bfloat16

評価結果

Open LLM Leaderboardでの評価結果は以下の通りです。詳細な結果はこちらで確認できます。

評価指標	値
平均	71.35
AI2 Reasoning Challenge (25-Shot)	69.37
HellaSwag (10-Shot)	86.60
MMLU (5-Shot)	64.91
TruthfulQA (0-shot)	62.96
Winogrande (5-shot)	80.82
GSM8k (5-shot)	63.46