MobileLLaMA-1.4B-BaseオープンソースAIモデル - 簡単にデプロイして様々なシーンでのアプリケーションを実現

ホーム

Mobilellama 1.4B Base

mtgvによって開発

MobileLLaMA-1.4B-Baseは14億パラメータのTransformerモデルで、RedPajama v1データセットに基づいてトレーニングされ、すぐに使用できるデプロイメント向けに設計されています。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #軽量LLM #RedPajamaトレーニング #モバイルデプロイメント

ダウンロード数 1,376

リリース時間 : 12/28/2023

モデル概要

このモデルはLLaMAをスケールダウンしたバージョンで、効率的なデプロイメントと使用を目的としており、自然言語理解と常識推論タスクに適しています。

モデル特徴

スケールダウン

LLaMAをスケールダウンし、すぐに使用できるデプロイメントを容易にしました。

研究の再現性

すべてのモデルはRedPajama v1データセットの1.3兆トークンのみでトレーニングされており、変数制御実験が容易です。

高性能

標準的な自然言語ベンチマークテストで最新のオープンソースモデルと同等の性能を発揮します。

モデル能力

テキスト生成

自然言語理解

常識推論

使用事例

自然言語処理

言語理解

自然言語テキストの評価と理解に使用されます。

標準ベンチマークテストで良好な性能を示します。

常識推論

常識的な質問の推論と回答に使用されます。

標準ベンチマークテストで良好な性能を示します。

🚀 MobileLLaMA-1.4B-Base

MobileLLaMA-1.4B-Baseは、14億のパラメータを持つTransformerモデルです。LLaMAを縮小し、そのままでのデプロイを容易にしました。再現性を高めるため、すべてのモデルはRedPajama v1データセットの1.3Tトークンのみを使用して学習されています。これにより、コントロールされた実験が可能になり、さらなる研究に役立ちます。

🚀 クイックスタート

モデルの重みはHugging Face Transformersを使用して読み込むことができます。使用例はGithubで確認できます。

✨ 主な機能

当社のモデルは、言語理解と常識推論の2つの標準的な自然言語ベンチマークで広範に評価されています。実験結果から、MobileLLaMA 1.4Bは最新のオープンソースモデルと同等の性能を発揮することが示されています。

📦 インストール

ドキュメントに具体的なインストール手順が記載されていないため、このセクションをスキップします。

💻 使用例

ドキュメントに具体的なコード例が記載されていないため、このセクションをスキップします。

📚 ドキュメント

モデル情報

属性	详情
モデルタイプ	MobileLLaMA-1.4B-Baseは、14億のパラメータを持つTransformerモデルです。
学習データ	すべてのモデルはRedPajama v1データセットの1.3Tトークンのみを使用して学習されています。