L

Llama 3 8B Instruct 262k

gradientaiによって開発
Meta-Llama-3-8B-Instructを拡張した長文コンテキストモデルで、262kトークンのコンテキスト長をサポート
ダウンロード数 27.90k
リリース時間 : 4/25/2024

モデル概要

このモデルはRoPE theta最適化技術によりLlama-3 8Bのコンテキスト長を8kから262kに拡張、長文書処理やマルチターン対話シーンに適応

モデル特徴

超長文コンテキストサポート
RoPE theta最適化技術により262kトークンのコンテキスト長に拡張
効率的なトレーニング
漸進的トレーニング手法を採用し、わずか1.01億トークンで拡張を完了
対話能力最適化
UltraChatデータセットでファインチューニングし、アシスタント型対話性能を強化

モデル能力

長文テキスト生成
マルチターン対話
コード生成
知識質問応答

使用事例

企業アプリケーション
長文書分析
超長契約書、技術文書などの処理
262kトークン範囲内のキー情報を正確に抽出可能
自律型アシスタント
企業級対話アシスタントの展開
超長対話履歴の保持によるコンテキスト一貫性をサポート
研究アプリケーション
長系列モデリング
長文コンテキストが必要な研究シーン向け
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase