gemma-7b-zephyr-sftオープンソース大規模言語モデル - 無料でのデプロイで効率的なテキスト生成をサポート

ホーム

Gemma 7b Zephyr Sft

wandbによって開発

Google Gemma 7Bモデルをベースに、Zephyr SFTレシピでファインチューニングされた大規模言語モデルで、主にテキスト生成タスクに使用されます

大規模言語モデル

Transformers

オープンソースライセンス:その他 #英語テキスト生成 #Zephyrファインチューニング #マルチタスク推論

ダウンロード数 19

リリース時間 : 2/28/2024

モデル概要

これは85億パラメータのGPTタイプのモデルで、公開データセットと合成データセットの混合で教師ありファインチューニング(SFT)を行い、英語テキスト生成タスクに焦点を当てています。

モデル特徴

Zephyr SFTファインチューニング

Zephyr教師ありファインチューニングレシピで訓練され、対話や指示追従のパフォーマンスが向上しています

高性能ベンチマーク

オープンLLMリーダーボードの複数のベンチマークで優れた成績を収めています、例えばHellaSwag(80.73)やWinogrande(74.19)

計算効率の最適化

8xA100 80GBノードで訓練され、大規模モデルの計算効率が最適化されています

モデル能力

テキスト生成

質問応答システム

推論タスク

対話システム

知識質問応答

使用事例

教育

AI2推論チャレンジ

科学的推論問題の解決

標準化精度61.43

常識推論

HellaSwag評価

日常的な状況での常識推論

標準化精度80.73

Winogrande評価

照応解決と常識推論

精度74.19

数学能力

GSM8k評価

小学校の数学問題解決

精度49.81

評価指標	値
平均	61.64
AI2 Reasoning Challenge (25-Shot)	61.43
HellaSwag (10-Shot)	80.73
MMLU (5-Shot)	60.33
TruthfulQA (0-shot)	43.35
Winogrande (5-shot)	74.19
GSM8k (5-shot)	49.81

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Gemma 7b Zephyr Sft

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Gemma 7B Zephyr SFT

✨ 主要特性

モデル概要

学習レシピ

📄 ライセンス

🔌 コンピューティング環境

📊 Open LLM Leaderboard評価結果