P

Phi 3.5 Mini Instruct Onnx

由microsoft開發
Phi-3.5 Mini是一個輕量級、最先進的開放模型,支持128K令牌上下文長度,適用於內存/計算受限環境和低延遲場景。
下載量 1,056
發布時間 : 9/12/2024

模型概述

該模型是Phi-3.5 Mini-Instruct的ONNX優化版本,通過ONNX Runtime加速推理,可在CPU和GPU上跨設備運行。

模型特點

ONNX優化
提供INT4量化的CPU和GPU版本ONNX模型,顯著提升推理速度。
跨平臺支持
可在服務器平臺、Windows、Linux、Mac桌面及移動CPU上運行。
高效推理
在ONNX Runtime中性能優於PyTorch,INT4版本比PyTorch Compile快達21倍。
長上下文支持
支持128K令牌的上下文長度,適合處理長文檔。

模型能力

文本生成
代碼生成
數學推理
邏輯推理

使用案例

通用AI應用
對話系統
構建低延遲的聊天機器人
能夠生成幽默且符合上下文的回覆
代碼輔助
幫助開發者編寫和優化代碼
強大的代碼理解和生成能力
受限環境應用
邊緣設備AI
在內存和計算資源有限的設備上運行
通過量化實現高效推理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase