L

Llama 3 8B Instruct Gradient 1048k

gradientaiによって開発
Gradientが開発したLlama-3 8Bの長文コンテキスト拡張版で、100万トークンを超えるコンテキスト長をサポートし、RoPE thetaパラメータの最適化により効率的な長文処理能力を実現。
ダウンロード数 5,272
リリース時間 : 4/29/2024

モデル概要

Meta-Llama-3-8B-Instructを基に拡張した長文コンテキスト言語モデルで、段階的なトレーニングによりコンテキストウィンドウを8kから1048kに拡張。超長文ドキュメントの処理が必要な対話やテキスト生成タスクに適しています。

モデル特徴

超長文コンテキストサポート
RoPE thetaパラメータの最適化と段階的トレーニングにより、コンテキスト長を8kから1048kトークンに拡張
効率的なトレーニング戦略
NTK対応補間と階層的並列化戦略を採用し、33倍のトレーニング加速を実現
エンタープライズ向け最適化
企業レベルの長文ドキュメント処理シナリオ向けに設計され、自律型アシスタントの展開をサポート

モデル能力

長文ドキュメント理解
マルチターン対話
指示追従
テキスト生成
情報検索

使用事例

企業ドキュメント処理
法律契約分析
超長文の法律契約ドキュメントの解析と理解
重要な条項と条件を正確に抽出
技術マニュアルQA
長文技術ドキュメントに基づくQAシステム
複雑な技術質問に正確に回答
研究支援
学術論文要約
長文の学術論文の処理と分析
正確な研究要約を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase