K

Kangaroo

KangarooGroupによって開発
カンガルーは長編動画理解のために設計された強力なマルチモーダル大規模言語モデルで、中国語と英語のバイリンガル対話と長編動画入力に対応しています。
ダウンロード数 163
リリース時間 : 7/11/2024

モデル概要

カンガルーモデルは動画理解タスクに特化しており、動画の説明、質問応答、対話を含み、特に長編動画の処理に優れており、最大160フレームをサポートします。

モデル特徴

長編動画入力サポート
160フレームまでの入力能力を拡張し、異なるフレーム数とアスペクト比の動画を革新的に処理
優れたパフォーマンス
複数の動画理解ベンチマークテストでSOTAレベルを達成または超越
動画アノテーションシステム
データ選別と自動アノテーションシステムを開発し、大規模な動画-テキストデータセットを生成
バイリンガル対話能力
中国語と英語のシングルターン/マルチターン動画対話をサポート

モデル能力

動画コンテンツ記述
動画質問応答
動画対話
長編動画理解
中英バイリンガル処理

使用事例

動画コンテンツ分析
動画要約生成
動画コンテンツのテキスト要約を自動生成
動画のキーコンテンツを正確に捕捉可能
インテリジェントカスタマーサポート
動画製品質問応答
動画中の製品に関する様々な質問に回答
正確な製品情報を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase