L

Llama 3 6B V0.1

prince-canumaによって開発
世界初の60億パラメータのLlama-3ベースモデル、Meta-Llama-3-8Bからダウングレード循環技術で作成され、10億の英語テキストトークンで継続事前学習を実施
ダウンロード数 14
リリース時間 : 5/17/2024

モデル概要

Llama-3アーキテクチャに基づく6Bパラメータモデル、プログラミングアシスタント、RAG、関数呼び出しなど多様なシナリオの指示と対話アプリケーションに適応

モデル特徴

ダウングレード循環技術
大規模事前学習モデルのチェックポイントから異なる規模の新LLMを作成、一部の重みを複製し小規模モデルを初期化
効率的な事前学習
FineWebの10億純粋英語テキストトークンで継続事前学習を実施、低い損失値を達成
多様なシナリオ適応
プログラミングアシスタント、RAG、関数呼び出しなど多様なアプリケーションシナリオの指示と対話バージョン作成に利用可能

モデル能力

テキスト生成
プログラミング支援
質問応答システム
知識検索

使用事例

プログラミング開発
プログラミングアシスタント
開発者のプログラミング問題解決を支援、コード例を提供
Pythonなどの言語のコードスニペットを生成可能
知識質問応答
技術質問応答
技術関連の質問に回答
Python言語関連の質問に正確に回答可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase