P

Phi 4 Multimodal Instruct Onnx

Developed by microsoft
Phi-4多模態模型的ONNX版本,已量化為int4精度,通過ONNX Runtime加速推理,支持文本、圖像和音頻輸入。
Downloads 159
Release Time : 2/25/2025

Model Overview

這是一個輕量級開源多模態基礎模型,結合了Phi-3.5和4.0模型的語言、視覺和語音研究,支持128K token的上下文長度。

Model Features

多模態支持
支持處理文本、圖像和音頻輸入,生成文本輸出。
高效推理
已量化為int4精度,通過ONNX Runtime加速推理。
長上下文支持
支持128K token的上下文長度。
輕量級
輕量級開源多模態基礎模型,適合多種應用場景。

Model Capabilities

文本生成
圖像分析
語音識別
語音摘要
語音翻譯
視覺問答

Use Cases

語音處理
自動語音識別
將語音轉換為文本。
語音摘要
生成語音內容的摘要。
語音翻譯
將語音內容翻譯為其他語言。
視覺處理
視覺問答
根據圖像內容回答問題。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase