Sqft Phi 3 Mini 4k 50 Base Gptq
IntelLabsによって開発
microsoft/Phi-3-mini-4k-instructをベースにしたスパース量子化モデルで、Wandaスパース化とGPTQ-INT4量子化技術を採用し、スパース度は50%です。
ダウンロード数 364
リリース時間 : 5/10/2024
モデル概要
このモデルはスパース化と量子化処理を施したベース言語モデルで、効率的なテキスト生成や自然言語処理タスクに主に使用されます。
モデル特徴
効率的なスパース化
Wandaスパース化手法を採用し、スパース度50%を達成、モデルパラメータを大幅に削減。
低精度量子化
GPTQ-INT4量子化技術を使用し、モデルのストレージと計算要件を低減。
ハードウェア適応
ハードウェアを意識した自動機械学習最適化専用で、リソース制約環境での展開に適しています。
モデル能力
テキスト生成
自然言語処理
使用事例
効率的な推論
エッジデバイス展開
計算リソースが限られたエッジデバイスで効率的なテキスト生成タスクを実行。
計算とストレージ要件を削減し、推論速度を向上。
研究応用
モデル圧縮研究
スパース化と量子化技術がモデル性能に与える影響を研究するために使用。
効率的なベンチマークモデルを提供。
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-itの量子化バージョンで、多言語画像記述タスクをサポートします。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
その他
Colossus Project FluxのNunchaku量子化バージョンで、テキストプロンプトに基づいて高品質な画像を生成することを目的としています。このモデルは、推論効率を最適化しながら、性能損失を最小限に抑えます。
画像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
これはQwen2.5-VL-7Bモデルに基づく静的量子化バージョンで、画像記述生成タスクに特化し、複数の言語をサポートしています。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。
画像生成テキスト
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128kはQwen3 - 1.7Bをベースに開発された、プロキシ型ネットワーク検索と軽量ブラウジングに特化したモデルで、モバイルデバイスでも効率的に動作します。
大規模言語モデル
Transformers 英語

L
Mungert
263
2