P

Phi 3 Mini 4k Instruct Onnx Web

由microsoft開發
適用於瀏覽器內推理的Phi-3 Mini-4K-Instruct ONNX模型,通過ONNX Runtime Web加速瀏覽器中的推理。
下載量 243
發布時間 : 5/17/2024

模型概述

這是一個輕量級、最先進的開源模型,擁有38億參數,專注於高質量和推理密集的特性,適用於常識、語言理解、數學、代碼、長上下文和邏輯推理等任務。

模型特點

瀏覽器內推理
完全在瀏覽器中運行,無需服務器支持,通過ONNX Runtime Web加速。
輕量級高性能
38億參數的輕量級模型,在參數少於130億的模型中展現了強大且最先進的性能。
WebGPU加速
推薦使用WebGPU後端高效運行,在NVIDIA GeForce RTX 4090上可達約42個令牌/秒。
優化存儲
模型為fp16,權重採用int4塊量化,確保模型和外部數據文件保持在2GB以下,便於在Chromium中緩存。

模型能力

文本生成
常識推理
語言理解
數學計算
代碼生成
邏輯推理

使用案例

對話系統
智能聊天機器人
構建完全在瀏覽器中運行的對話式AI應用。
低延遲的交互體驗
教育
學習助手
幫助學生解答數學、編程等問題。
提供即時、準確的解答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase