L

Llama2 Xs 460M Experimental

ahxtによって開発
このシリーズのリポジトリではMeta AIのLLaMAとLLaMA 2大規模言語モデルを再現していますが、モデル規模は大幅に縮小されており、llama1_s実験版は18億パラメータ、llama2_xs実験版はわずか4.6億パラメータです。
ダウンロード数 145
リリース時間 : 7/26/2023

モデル概要

LLaMa軽量版はLLaMAとLLaMA 2の縮小規模実験バージョンで、より軽量な大規模言語モデルの選択肢を提供し、研究用途に適しています。

モデル特徴

軽量アーキテクチャ
オリジナルのLLaMAモデルの規模を大幅に縮小し、より効率的な推論能力を提供
オープンソース再現
Meta AIのLLaMAとLLaMA 2アーキテクチャを完全に再現
研究向け設計
研究目的に特化して設計されており、学術実験やモデル分析が容易

モデル能力

英語テキスト生成
質問応答タスク処理
知識推論

使用事例

学術研究
言語モデル圧縮研究
大規模言語モデルの圧縮と効率最適化の研究
4.6億パラメータの軽量モデルを実現
教育応用
質問応答システム
軽量な質問応答システムの構築
MMLUタスクで26.39の5サンプル精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase