I

Internvl2 5 HiMTok 8B

由yayafengzi開發
HiMTok是一個基於InternVL2_5-8B大型多模態模型微調的分層掩碼標記學習框架,專注於圖像分割任務。
下載量 16
發布時間 : 3/20/2025

模型概述

該模型通過分層掩碼標記學習框架,實現了高效的圖像分割功能,特別適用於refcoco系列數據集上的任務。

模型特點

分層掩碼標記學習
採用分層結構處理圖像分割任務,提高分割精度和效率
多模態能力
結合視覺和語言理解能力,支持複雜的圖像分割任務
基於大型預訓練模型
在InternVL2_5-8B基礎上微調,具備強大的特徵提取能力

模型能力

圖像分割
掩碼生成
多模態理解
視覺-語言任務處理

使用案例

計算機視覺
參考圖像分割
根據文本描述對圖像中的特定區域進行分割
在refcoco系列數據集上表現良好
交互式圖像編輯
通過自然語言指令指導圖像編輯和修改
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase