P

Phi 3 Small 8k Instruct Onnx Cuda

由microsoft開發
Phi-3 Small是一個70億參數的輕量級前沿開源模型,針對NVIDIA GPU優化的ONNX版本,支持8K上下文長度,具備強推理能力。
下載量 115
發布時間 : 5/19/2024

模型概述

本模型為Phi-3 Small-8K-Instruct的ONNX Runtime推理轉換版,通過ONNX Runtime在服務器平臺、Windows和Linux等設備的GPU上運行。

模型特點

高性能推理
FP16 CUDA版本比PyTorch快達4倍,INT4 CUDA版本快達10.9倍
輕量級設計
70億參數規模,在保持高性能的同時降低資源消耗
長上下文支持
支持8K token的上下文長度,適合處理長文本任務
多平臺兼容
通過ONNX Runtime支持多種設備和操作系統

模型能力

文本生成
指令遵循
常識推理
語言理解
數學計算
代碼生成
邏輯推理

使用案例

對話系統
智能助手
構建高性能、低延遲的對話助手
在A100 GPU上實現每秒74.62 tokens的生成速度
內容生成
長文本生成
利用8K上下文長度生成連貫的長篇內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase