LLaVA-NeXT-Video-7B-hf開源多模態模型 - 免費處理視頻與文本並生成文本輸出

首頁

Llava NeXT Video 7B Hf

由FriendliAI開發

LLaVA-NeXT-Video-7B-hf 是一個基於視頻的多模態模型，能夠處理視頻和文本輸入，生成文本輸出。

視頻生成文本

Safetensors

英語#視頻理解 #多模態對話 #長視頻處理

下載量 30

發布時間 : 3/5/2025

模型概述

該模型是一個視頻文本轉文本的多模態模型，專注於理解和處理視頻內容，並生成相關的文本描述或回答。

模型特點

多模態處理

能夠同時處理視頻和文本輸入，生成相關的文本輸出。

視頻理解

專注於視頻內容的理解和分析，適用於視頻相關的任務。

模型能力

視頻內容理解

文本生成

多模態交互

使用案例

視頻分析

視頻內容描述

生成視頻內容的文本描述，適用於視頻摘要或內容分析。

視頻問答

回答關於視頻內容的特定問題，適用於視頻檢索或教育應用。

屬性	詳情
模型類型	視頻文本到文本
訓練數據	lmms-lab/VideoChatGPT

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Llava NeXT Video 7B Hf

模型概述

模型特點

模型能力

使用案例

🚀 llava-hf/LLaVA-NeXT-Video-7B-hf

🚀 快速開始

✨ 主要特性

📦 安裝指南

💻 使用示例

📚 詳細文檔

差異說明

🔧 技術細節

📄 許可證