T

Tinyllava Video Coldstart NextQA 16

由Zhang199開發
TinyLLaVA-Video-R1 是一個視頻文本到文本模型,通過使用來自NextQA數據集的16個手動標註樣本對TinyLLaVA-Video進行冷啟動訓練獲得。
下載量 63
發布時間 : 4/13/2025

模型概述

該模型主要用於視頻文本到文本的任務,是TinyLLaVA-Video-R1的基礎模型。

模型特點

冷啟動訓練
使用來自NextQA數據集的16個手動標註樣本進行冷啟動訓練。
輕量化
基於TinyLLaVA-Video模型,可能具有較小的模型尺寸和較高的效率。

模型能力

視頻文本轉換
文本生成

使用案例

視頻理解
視頻問答
基於視頻內容生成回答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase