P

Phi 3.5 Mini Instruct Onnx

由 microsoft 开发
Phi-3.5 Mini是一个轻量级、最先进的开放模型,支持128K令牌上下文长度,适用于内存/计算受限环境和低延迟场景。
下载量 1,056
发布时间 : 9/12/2024

模型简介

该模型是Phi-3.5 Mini-Instruct的ONNX优化版本,通过ONNX Runtime加速推理,可在CPU和GPU上跨设备运行。

模型特点

ONNX优化
提供INT4量化的CPU和GPU版本ONNX模型,显著提升推理速度。
跨平台支持
可在服务器平台、Windows、Linux、Mac桌面及移动CPU上运行。
高效推理
在ONNX Runtime中性能优于PyTorch,INT4版本比PyTorch Compile快达21倍。
长上下文支持
支持128K令牌的上下文长度,适合处理长文档。

模型能力

文本生成
代码生成
数学推理
逻辑推理

使用案例

通用AI应用
对话系统
构建低延迟的聊天机器人
能够生成幽默且符合上下文的回复
代码辅助
帮助开发者编写和优化代码
强大的代码理解和生成能力
受限环境应用
边缘设备AI
在内存和计算资源有限的设备上运行
通过量化实现高效推理
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase