M

Microllama

keeeeenwによって開発
MicroLlamaは個人開発者keeeeenwが500ドルの予算内で事前学習した3億パラメータのLlamaモデルで、英語テキスト生成タスクに特化しています。
ダウンロード数 2,955
リリース時間 : 3/29/2024

モデル概要

これは小型化されたLlamaモデルで、限られたリソース下でも効果的な大規模言語モデルを訓練できることを証明することを目的としています。モデルはTinyLlamaプロジェクトを基に変更され、コード関連データを削除し、汎用テキスト生成に焦点を当てています。

モデル特徴

低コスト訓練
500ドルの予算内で訓練を完了し、小型化LLMの実現可能性を証明
完全オープンソース
完全にオープンソースのデータセットとモデルアーキテクチャを使用し、独自データに依存しない
軽量級
わずか3億パラメータで、リソースが限られた環境での展開に適している

モデル能力

英語テキスト生成
質問応答システム
言語理解

使用事例

教育研究
小型LLM研究
リソースが制限された環境下でのLLM性能を研究するためのケーススタディとして
小型モデルでも一定の性能を達成できることを証明
アプリケーション開発
軽量級チャットボット
モバイル端末やエッジデバイス向けの対話型アプリケーションに適しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase