I

Idefics 9b Instruct

由HuggingFaceM4開發
IDEFICS 是 Deepmind 開發的閉源視覺語言模型 Flamingo 的開源復現版本,是一個多模態模型,可以接受任意序列的圖像和文本輸入,並生成文本輸出。
下載量 28.34k
發布時間 : 7/24/2023

模型概述

IDEFICS 是一個大型多模態英語模型,接受交錯的圖像和文本序列作為輸入,並生成文本輸出。該模型表現出強大的上下文少樣本學習能力,與閉源模型相當。

模型特點

多模態能力
可以同時處理圖像和文本輸入,生成連貫的文本輸出
開源復現
完全基於公開可用的數據和模型構建,復現了閉源 Flamingo 模型的功能
少樣本學習
表現出強大的上下文少樣本學習能力,與閉源模型相當

模型能力

圖像問答
圖像描述
多圖像故事創作
純文本語言模型

使用案例

內容生成
圖像描述生成
根據輸入圖像生成詳細的文字描述
生成與圖像內容高度一致的描述文本
教育
視覺問答
回答關於圖像內容的各類問題
準確回答關於圖像內容的開放性和選擇題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase