e.star.7.bオープンソース大規模言語モデル - Mistralアーキテクチャに基づき、複数のテストで優れた性能を発揮し、効率的なトレーニングが可能

ホーム

E.star.7.b

liminerityによって開発

Mistralアーキテクチャに基づく7Bパラメータの大規模言語モデル。UnslothとTRLライブラリを使用した効率的なトレーニングにより、複数のベンチマークテストで優れたパフォーマンスを発揮。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #効率的なファインチューニング #知識推論 #数学問題解決

ダウンロード数 86

リリース時間 : 3/24/2024

モデル概要

このテキスト生成モデルは、yam-peleg/Experiment26-7Bをファインチューニングしたもので、高品質なテキスト生成能力を提供することに特化しています。

モデル特徴

効率的なトレーニング

UnslothとTRLライブラリを使用したトレーニングで、速度が2倍向上

マルチタスク性能

AI2推論チャレンジ、HellaSwagなどの複数のベンチマークテストで優れた成績

オープンソースライセンス

Apache 2.0ライセンスを採用し、商用利用を許可

モデル能力

テキスト生成

質問応答システム

推論タスク

知識質問応答

使用事例

教育

知識質問応答

様々な学問分野の知識問題に回答

MMLUテストで63.44%の精度を達成

研究

推論タスク

論理的推論問題を解決

AI2推論チャレンジで標準化精度63.91%を達成

ビジネス

コンテンツ生成

様々なビジネス文書を生成

属性	详情
開発者	gate369
モデルタイプ	mistral
ファインチューニング元モデル	yam-peleg/Experiment26-7B
ライセンス	apache-2.0

評価指標	値
平均	68.28
AI2 Reasoning Challenge (25-Shot)	63.91
HellaSwag (10-Shot)	86.02
MMLU (5-Shot)	63.44
TruthfulQA (0-shot)	54.91
Winogrande (5-shot)	80.19
GSM8k (5-shot)	61.18

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

E.star.7.b

モデル概要

モデル特徴

モデル能力

使用事例

🚀 e.star.7.b

🚀 クイックスタート

✨ 主な機能

📦 インストール

💻 使用例

📚 ドキュメント

モデル情報

評価結果

🔧 技術詳細

📄 ライセンス