D

Documentcogito

由Daemontatox開發
基於unsloth/Llama-3.2-11B-Vision-Instruct進行精調的多模態模型,針對視覺-語言任務優化並增強指令跟隨能力,通過Unsloth框架實現2倍訓練加速
下載量 73
發布時間 : 1/16/2025

模型概述

本模型結合Unsloth框架與Hugging Face的TRL庫,在保持高性能的同時實現高效訓練,適用於視覺文本生成、多模態指令跟隨等任務

模型特點

高效訓練
採用Unsloth框架實現2倍訓練速度提升
多模態能力
強化視覺與語言交互處理能力
指令優化
專門優化指令理解與執行能力

模型能力

視覺文本生成
多模態推理
指令跟隨
圖像描述生成

使用案例

視覺內容分析
圖像描述生成
根據輸入圖像生成詳細文字描述
在開放大模型排行榜中指令跟隨準確率達50.64%
教育輔助
多模態學習
結合視覺與文本信息進行教學輔助
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase