P

Phi 4 Multimodal Instruct Onnx

由microsoft開發
Phi-4多模態模型的ONNX版本,已量化為int4精度,通過ONNX Runtime加速推理,支持文本、圖像和音頻輸入。
下載量 159
發布時間 : 2/25/2025

模型概述

這是一個輕量級開源多模態基礎模型,結合了Phi-3.5和4.0模型的語言、視覺和語音研究,支持128K token的上下文長度。

模型特點

多模態支持
支持處理文本、圖像和音頻輸入,生成文本輸出。
高效推理
已量化為int4精度,通過ONNX Runtime加速推理。
長上下文支持
支持128K token的上下文長度。
輕量級
輕量級開源多模態基礎模型,適合多種應用場景。

模型能力

文本生成
圖像分析
語音識別
語音摘要
語音翻譯
視覺問答

使用案例

語音處理
自動語音識別
將語音轉換為文本。
語音摘要
生成語音內容的摘要。
語音翻譯
將語音內容翻譯為其他語言。
視覺處理
視覺問答
根據圖像內容回答問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase