P

Pixtral 12B Captioner Relaxed

由unalignment開發
基於Pixtral-12B-2409微調的多模態大語言模型,專注於生成豐富的圖像描述
下載量 26
發布時間 : 1/22/2025

模型概述

該模型通過指令微調優化了圖像描述生成能力,能夠為給定圖像生成更全面、更具層次感的細節描述,特別適合構建文本-圖像數據集

模型特點

細節增強
生成更全面、更具層次感的圖像描述
寬鬆約束
相比基礎模型提供限制更少的圖像描述
自然語言定位
用自然語言描述圖像中不同主體的位置關係
圖像生成優化
輸出格式兼容前沿文生圖模型

模型能力

圖像描述生成
多模態理解
自然語言處理

使用案例

圖像數據集構建
自動圖像標註
為圖像生成詳細的文本描述
提高數據集構建效率
輔助創作
文生圖模型輸入優化
為文生圖模型提供更豐富的文本提示
提升生成圖像的質量和多樣性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase