K

Kangaroo

由KangarooGroup開發
袋鼠是一個專為長視頻理解設計的強大多模態大語言模型,支持中英雙語對話和長視頻輸入。
下載量 163
發布時間 : 7/11/2024

模型概述

袋鼠模型專注於視頻理解任務,包括視頻描述、問答和對話,特別擅長處理長視頻輸入,最大支持160幀。

模型特點

長視頻輸入支持
通過擴展至160幀輸入能力,創新性地處理不同幀數和寬高比的視頻
卓越性能表現
在多個視頻理解基準測試中達到或超越SOTA水平
視頻標註系統
開發了數據篩選與自動標註系統,生成大規模視頻-文本數據集
雙語對話能力
支持中英文雙語單輪/多輪視頻對話

模型能力

視頻內容描述
視頻問答
視頻對話
長視頻理解
中英雙語處理

使用案例

視頻內容分析
視頻摘要生成
自動生成視頻內容的文字摘要
可準確捕捉視頻關鍵內容
智能客服
視頻產品問答
回答用戶關於視頻中產品的各種問題
提供準確的產品信息解答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase