L

Longva 7B TPO

ruili0によって開発
LongVA-7B-TPOはLongVA-7Bを基に時系列選好最適化を施した動画-テキストモデルで、長動画理解タスクで優れた性能を発揮します。
ダウンロード数 225
リリース時間 : 1/14/2025

モデル概要

このモデルは長動画理解タスクに特化しており、時系列選好最適化技術により長動画ベンチマークテストでの性能が向上しています。

モデル特徴

時系列選好最適化
時系列選好最適化技術により長動画理解能力が大幅に向上
高性能
複数のベンチマークテストで最先端の性能を確立し、ベースモデル比平均2%向上
マルチモーダル処理
画像と動画入力を同時に処理し、対応するテキスト記述を生成可能

モデル能力

長動画コンテンツ理解
動画コンテンツ記述生成
画像コンテンツ記述生成
マルチモーダル推論

使用事例

アクセシビリティサービス
視覚障害者向け動画支援
視覚障害者向けに動画内容を詳細に記述
正確な動画内容記述を提供
動画コンテンツ分析
長動画内容理解
長動画中の時系列情報と内容を分析
長動画中の複雑な内容を正確に理解
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase