P

Phi 4 Mini Instruct Float8dq

由pytorch開發
Phi-4-mini-instruct模型經torchao進行float8動態激活和權重量化,在H100上實現36%顯存降低和15-20%速度提升,幾乎不影響精度。
下載量 1,006
發布時間 : 4/8/2025

模型概述

基於Microsoft Phi-4-mini-instruct的量化版本,適用於文本生成任務,支持多語言交互和數學推理。

模型特點

高效量化
採用float8動態激活和權重量化技術,顯著降低顯存佔用
性能優化
在H100上實現15-20%推理速度提升
多任務支持
支持代碼生成、數學推理和對話任務
精度保留
量化後模型精度損失極小(基準測試顯示總體表現僅下降0.24%)

模型能力

文本生成
數學問題求解
代碼生成
多語言對話
邏輯推理

使用案例

教育輔助
數學解題
幫助學生理解代數方程解法
可正確解答2x+3=7類方程
創意生成
食譜建議
生成水果搭配創意食譜
提供香蕉火龍果奶昔等具體方案
技術問答
編程幫助
解釋代碼邏輯或生成代碼片段
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase