L

Llama 3.1 Nemotron 70B Instruct HF GGUF

Mungertによって開発
Meta Llama-3.1-70B-Instructをファインチューニングしたモデルで、NVIDIA HelpSteer2データセットで最適化されており、テキスト生成タスクをサポートします。
ダウンロード数 1,434
リリース時間 : 4/6/2025

モデル概要

これは700億パラメータの大規模言語モデルで、命令追従とテキスト生成タスクに最適化されており、様々な自然言語処理シナリオに適用可能です。

モデル特徴

IQ-DynamicGate超低ビット量子化
1-2ビット精度適応量子化技術を採用し、メモリ効率を維持しながらモデル精度を向上させます。
階層型量子化戦略
異なるネットワーク層に対して差別化された量子化スキームを適用し、重要なコンポーネントを保護して誤差伝播を低減します。
マルチフォーマットサポート
BF16から極低ビットIQ3_XSまで様々な量子化フォーマットを提供し、異なるハードウェア要件に対応します。

モデル能力

テキスト生成
命令追従
低リソース推論

使用事例

リソース制約環境
エッジデバイス展開
メモリが限られたエッジデバイスで大規模言語モデルを実行
超低ビット量子化により許容可能な推論速度を実現
研究分野
量子化技術研究
超低ビット量子化がLLM性能に与える影響を研究
複数の量子化スキームの比較データを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase