SpyazWeb_AI_DeepMind_Projectオープンソース大規模モデル - 多言語テキスト生成と複雑な推論をサポート

ホーム

Spyazweb AI DeepMind Project

LeroyDyerによって開発

Mixtralアーキテクチャに基づく多機能大規模言語モデルで、深層マインドと自己最適化能力を融合し、多言語テキスト生成と複雑な推論タスクをサポート

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #マルチタスクテキスト生成 #自己最適化学習 #医療-プログラミングの二重領域

ダウンロード数 97

リリース時間 : 5/7/2024

モデル概要

このモデルはDeepMindプロジェクトの中核成果であり、自己反省、エージェント生成、思考連鎖などの高度な認知能力を備え、オープンドメイン対話、コード生成、数学的推論など多様なシナリオに適用可能

モデル特徴

マルチモーダル拡張能力

CLIPトレーニング能力を統合済みで、視覚-言語マルチモーダルタスクに拡張可能

自己教育最適化

子供の学習プロセスに類似した自己最適化メカニズムをサポート

複雑推論能力

AI2推論チャレンジ（ARC）で61.86%の標準化精度を達成

多言語サポート

英語以外にスワヒリ語のトレーニングデータを含む

モデル能力

テキスト生成

コード生成

数学的問題解決

オープンドメイン対話

多言語処理

複雑推論

自己最適化学習

使用事例

教育研究

数学問題解答

GSM8K数学問題集を解決

51.86%精度（5回few-shot）

ビジネスインテリジェンス

SQL生成

自然言語に基づいてSQLクエリを生成

synthetic_text_to_sqlデータセットでトレーニング

多言語アプリケーション

スワヒリ語処理

英語-スワヒリ語の二言語タスク処理

SwahiliPlatypusなどの専門データセットでトレーニング

🚀 Mixtral_AI_CyberTron_DeepMind_III_UFT

このプロジェクトは、最先端のテキスト生成モデルを開発しており、様々なタスクで高い性能を発揮します。独自の手法を用いてモデルに機能を追加し、自己学習や最適化を可能にしています。

🚀 クイックスタート

このモデルは、多くのデータセットを使用してトレーニングされており、様々なタスクに対応しています。以下のようなことが可能です。

複雑な質問に対する自己検討と回答生成
小さなタスクを実行するミニエージェントの生成
思考や反射、センスを持った回答の生成
コーディングや医療情報に関するタスクの実行

✨ 主な機能

SelfRAG：独自の情報検索機能を持ち、関連情報を効率的に収集します。
エージェント生成：小さなタスクを実行するミニエージェントを生成します。
思考連鎖：複雑な問題を段階的に解決するための思考連鎖を形成します。
深い思考と記憶想起：深い思考を行い、過去の情報を想起して回答を生成します。

📦 インストール

このモデルは、Unsloth と Huggingface の TRL ライブラリを使用して 2 倍速でトレーニングされています。

📚 ドキュメント

モデル情報

属性	详情
モデルタイプ	Text Generation Inference, Transformers
ベースモデル	LeroyDyer/Mixtral_AI_CyberTron_DeepMind_III
トレーニングデータ	gretelai/synthetic_text_to_sql, HuggingFaceTB/cosmopedia, teknium/OpenHermes - 2.5 など多数
評価指標	accuracy, bertscore, bleu など多数

評価結果

Open LLM Leaderboard での評価結果は以下の通りです。

評価指標	値
平均	64.37
AI2 Reasoning Challenge (25 - Shot)	61.86
HellaSwag (10 - Shot)	83.15
MMLU (5 - Shot)	61.95
TruthfulQA (0 - shot)	49.41
Winogrande (5 - shot)	77.98
GSM8k (5 - shot)	51.86