L

Llama3 ChatQA 2 8B

nvidiaによって開発
Llama-3ベースモデルを開発した128K長文脈大規模言語モデルで、RAGと長文理解能力の向上に焦点を当てています
ダウンロード数 437
リリース時間 : 8/28/2024

モデル概要

オープンソース大規模言語モデルと専有モデルの間にある長文脈理解と検索拡張生成(RAG)能力のギャップを埋め、128Kトークンの超長文脈処理をサポートします

モデル特徴

128K超長文脈
3段階の微調整プロセスによりコンテキストウィンドウを8Kから128Kトークンに拡張
強化されたRAG能力
検索拡張生成シナリオ向けに特別に最適化され、GPT-4-Turboレベルの性能に近い
多段階トレーニング手法
改良版ChatQA-1.5論文のトレーニング手法を採用
2バージョン選択
8Bと70Bの2つのパラメータサイズバージョンを提供し、異なるニーズに対応

モデル能力

長文理解
検索拡張生成
指示追従
ドキュメントQA
マルチターン対話

使用事例

金融分析
財務報告データ分析
長文の財務報告から主要指標とトレンド分析を抽出
純利益変化などの主要財務指標を正確に識別可能
知識QA
長文ドキュメントQA
超長文技術文書や研究論文に基づく専門的な質問に回答
32Kトークン以上の長文QAで優れた性能を発揮
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase