P

Phi 3.5 Mini Instruct Onnx

Developed by microsoft
Phi-3.5 Mini是一個輕量級、最先進的開放模型,支持128K令牌上下文長度,適用於內存/計算受限環境和低延遲場景。
Downloads 1,056
Release Time : 9/12/2024

Model Overview

該模型是Phi-3.5 Mini-Instruct的ONNX優化版本,通過ONNX Runtime加速推理,可在CPU和GPU上跨設備運行。

Model Features

ONNX優化
提供INT4量化的CPU和GPU版本ONNX模型,顯著提升推理速度。
跨平臺支持
可在服務器平臺、Windows、Linux、Mac桌面及移動CPU上運行。
高效推理
在ONNX Runtime中性能優於PyTorch,INT4版本比PyTorch Compile快達21倍。
長上下文支持
支持128K令牌的上下文長度,適合處理長文檔。

Model Capabilities

文本生成
代碼生成
數學推理
邏輯推理

Use Cases

通用AI應用
對話系統
構建低延遲的聊天機器人
能夠生成幽默且符合上下文的回覆
代碼輔助
幫助開發者編寫和優化代碼
強大的代碼理解和生成能力
受限環境應用
邊緣設備AI
在內存和計算資源有限的設備上運行
通過量化實現高效推理
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase