sqft-phi-3-mini-4k-50-base-gptqオープンソースモデル - 高速なデータ処理と分析を効率的にサポート

ホーム

Sqft Phi 3 Mini 4k 50 Base Gptq

IntelLabsによって開発

microsoft/Phi-3-mini-4k-instructをベースにしたスパース量子化モデルで、Wandaスパース化とGPTQ-INT4量子化技術を採用し、スパース度は50%です。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #スパース量子化モデル #GPTQ-INT4 #50%スパース度

ダウンロード数 364

リリース時間 : 5/10/2024

サイトを開く

モデル概要

このモデルはスパース化と量子化処理を施したベース言語モデルで、効率的なテキスト生成や自然言語処理タスクに主に使用されます。

モデル特徴

効率的なスパース化

Wandaスパース化手法を採用し、スパース度50%を達成、モデルパラメータを大幅に削減。

低精度量子化

GPTQ-INT4量子化技術を使用し、モデルのストレージと計算要件を低減。

ハードウェア適応

ハードウェアを意識した自動機械学習最適化専用で、リソース制約環境での展開に適しています。

モデル能力

テキスト生成

自然言語処理

使用事例

効率的な推論

エッジデバイス展開

計算リソースが限られたエッジデバイスで効率的なテキスト生成タスクを実行。

計算とストレージ要件を削減し、推論速度を向上。

研究応用

モデル圧縮研究

スパース化と量子化技術がモデル性能に与える影響を研究するために使用。

効率的なベンチマークモデルを提供。

Qwen2.5 VL 7B Abliterated Caption It I1 GGUF

Apache-2.0

Qwen2.5-VL-7B-Abliterated-Caption-itの量子化バージョンで、多言語画像記述タスクをサポートします。

Nunchaku Flux.1 Dev Colossus

その他

Colossus Project FluxのNunchaku量子化バージョンで、テキストプロンプトに基づいて高品質な画像を生成することを目的としています。このモデルは、推論効率を最適化しながら、性能損失を最小限に抑えます。

画像生成英語

nunchaku-tech

235

Qwen2.5 VL 7B Abliterated Caption It GGUF

Apache-2.0

これはQwen2.5-VL-7Bモデルに基づく静的量子化バージョンで、画像記述生成タスクに特化し、複数の言語をサポートしています。

olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。

Lucy-128kはQwen3 - 1.7Bをベースに開発された、プロキシ型ネットワーク検索と軽量ブラウジングに特化したモデルで、モバイルデバイスでも効率的に動作します。

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Sqft Phi 3 Mini 4k 50 Base Gptq

モデル紹介

コンテンツ詳細

代替品

モデル概要

モデル特徴

モデル能力

使用事例

🚀 SQFTベースモデル: sqft-phi-3-mini-4k-50-base-gptq

🚀 クイックスタート

✨ 主な機能

📚 ドキュメント

モデルソース

引用

謝辞

📄 ライセンス

代替品