Cockatiel - 8B開源視頻字幕生成模型，為視頻生成符合人類偏好的詳細字幕

首頁

Cockatiel 8B

由Fr0zencr4nE開發

基於VILA-v1.5-8B構建的視頻字幕生成模型，能夠為輸入視頻生成詳細且符合人類偏好的字幕。

視頻生成文本

Transformers

#視頻詳細字幕生成 #人類偏好優化 #多模態理解

下載量 19

發布時間 : 3/12/2025

模型概述

該模型通過合成數據與人類偏好訓練集成實現精細視頻字幕生成，適用於需要高質量視頻描述的場景。

模型特點

精細視頻字幕生成

能夠為輸入視頻生成詳細且符合人類偏好的字幕。

合成數據與人類偏好訓練

通過合成數據與人類偏好訓練集成實現高質量字幕生成。

基於VILA-v1.5-8B構建

基於強大的VILA-v1.5-8B模型構建，具有競爭力的性能。

模型能力

視頻字幕生成

多模態理解

詳細描述生成

使用案例

視頻內容理解

視頻字幕生成

為輸入視頻生成詳細且符合人類偏好的字幕。

高質量的視頻描述，適用於視頻內容理解與檢索。

多模態應用

視頻內容分析

結合視頻與文本信息進行內容分析。

提升視頻內容理解的準確性與詳細程度。

屬性	詳情
模型類型	視頻文本到文本生成模型
訓練數據	未提及

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Cockatiel 8B

模型概述

模型特點

模型能力

使用案例

🚀 鸚鵡視頻字幕生成模型（Cockatiel）

🚀 快速開始

📄 許可證

📋 模型信息