Minicpm O 2 6 Int4
MiniCPM-o 2.6的int4量化版本,顯著降低GPU顯存佔用,支持多模態處理能力。
Downloads 4,249
Release Time : 1/13/2025
Model Overview
這是一個支持視覺、語音與直播流的多模態大語言模型,特別優化了手機端運行能力,具備GPT-4o級別的多模態處理能力。
Model Features
手機端運行優化
特別優化可在手機端運行的GPT-4o級多模態模型
多模態支持
支持視覺、語音、直播流等多種模態輸入輸出
低顯存佔用
int4量化版本顯著降低GPU顯存需求至約9GB
即時處理能力
支持直播和即時語音對話處理
Model Capabilities
視覺處理
光學字符識別
多圖像處理
視頻分析
自定義代碼執行
音頻處理
語音克隆
直播流處理
即時語音對話
自動語音識別
文本轉語音
Use Cases
多媒體處理
即時直播分析
對直播視頻流進行即時內容分析和交互
實現低延遲的直播內容理解和響應
跨模態內容生成
根據圖像生成描述文本,或根據文本生成語音
實現不同模態內容間的轉換和生成
移動應用
手機端智能助手
在移動設備上運行的多模態智能助手
提供視覺、語音等綜合交互能力
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98