Sqft Phi 3 Mini 4k 50 Base Gptq
S

Sqft Phi 3 Mini 4k 50 Base Gptq

IntelLabsによって開発
microsoft/Phi-3-mini-4k-instructをベースにしたスパース量子化モデルで、Wandaスパース化とGPTQ-INT4量子化技術を採用し、スパース度は50%です。
ダウンロード数 364
リリース時間 : 5/10/2024

モデル概要

このモデルはスパース化と量子化処理を施したベース言語モデルで、効率的なテキスト生成や自然言語処理タスクに主に使用されます。

モデル特徴

効率的なスパース化
Wandaスパース化手法を採用し、スパース度50%を達成、モデルパラメータを大幅に削減。
低精度量子化
GPTQ-INT4量子化技術を使用し、モデルのストレージと計算要件を低減。
ハードウェア適応
ハードウェアを意識した自動機械学習最適化専用で、リソース制約環境での展開に適しています。

モデル能力

テキスト生成
自然言語処理

使用事例

効率的な推論
エッジデバイス展開
計算リソースが限られたエッジデバイスで効率的なテキスト生成タスクを実行。
計算とストレージ要件を削減し、推論速度を向上。
研究応用
モデル圧縮研究
スパース化と量子化技術がモデル性能に与える影響を研究するために使用。
効率的なベンチマークモデルを提供。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase