L

Llama 3 8B Instruct Gradient 4194k

gradientaiによって開発
Meta-Llama-3-8B-Instructを基に拡張した長文コンテキストモデル。RoPE thetaパラメータ調整により4194Kのコンテキスト長をサポート
ダウンロード数 244
リリース時間 : 5/4/2024

モデル概要

このモデルはMeta-Llama-3-8B-Instructの拡張版で、漸進的トレーニングによりコンテキスト長を8kから4194Kまで拡張。超長文テキスト処理が必要な対話シナリオに適している

モデル特徴

超長文コンテキストサポート
RoPE thetaパラメータ調整と漸進的トレーニングにより、コンテキスト長を8kから4194Kに拡張
効率的なトレーニング手法
NTK-aware補間法とスケーリング則を用いてRoPE thetaの最適調整計画を設定
高性能インフラストラクチャ
EasyContext Blockwise RingAttentionライブラリを基に、L40Sクラスタで効率的でスケーラブルなトレーニングを実現

モデル能力

長文テキスト生成
対話システム
命令追従
コード生成

使用事例

企業アプリケーション
長文ドキュメント処理
超長文の企業ドキュメント、契約書、レポートの処理と分析
400万トークンを超えるコンテキスト一貫性を維持可能
自律型アシスタント
企業の重要業務を駆動する自律型AIアシスタントの展開
企業データを統合したインテリジェントな意思決定サポートを実現
研究アプリケーション
長系列モデリング
科学研究における長系列データの分析とモデリング
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase