🚀 視頻MAE基礎模型在UCF101數據集上微調版本
這是一個在UCF101數據集上微調的VideoMAE基礎模型,可用於視頻動作識別任務。
🚀 快速開始
使用以下代碼開始使用該模型:
點擊展開
from decord import VideoReader, cpu
import torch
import numpy as np
from transformers import VideoMAEFeatureExtractor, VideoMAEForVideoClassification
from huggingface_hub import hf_hub_download
np.random.seed(0)
def sample_frame_indices(clip_len, frame_sample_rate, seg_len):
converted_len = int(clip_len * frame_sample_rate)
end_idx = np.random.randint(converted_len, seg_len)
start_idx = end_idx - converted_len
indices = np.linspace(start_idx, end_idx, num=clip_len)
indices = np.clip(indices, start_idx, end_idx - 1).astype(np.int64)
return indices
file_path = hf_hub_download(
repo_id="nateraw/dino-clips", filename="archery.mp4", repo_type="space"
)
videoreader = VideoReader(file_path, num_threads=1, ctx=cpu(0))
videoreader.seek(0)
indices = sample_frame_indices(clip_len=16, frame_sample_rate=4, seg_len=len(videoreader))
video = videoreader.get_batch(indices).asnumpy()
feature_extractor = VideoMAEFeatureExtractor.from_pretrained("nateraw/videomae-base-finetuned-ucf101")
model = VideoMAEForVideoClassification.from_pretrained("nateraw/videomae-base-finetuned-ucf101")
inputs = feature_extractor(list(video), return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])
✨ 主要特性
- 該模型基於VideoMAE基礎模型,在UCF101數據集上進行了微調。
- 可用於視頻動作識別任務。
📚 詳細文檔
模型詳情
模型描述
VideoMAE基礎模型在UCF101數據集上微調版本。
- 開發者:@nateraw
- 模型類型:微調模型
- 語言:英文
- 許可證:MIT
- 相關模型:
- 更多信息資源:[待補充]
用途
直接使用
該模型可用於視頻動作識別。
建議
直接用戶和下游用戶都應該瞭解該模型的風險、偏差和侷限性。如需進一步建議,還需更多信息。
訓練詳情
訓練數據
[待補充]
訓練過程
預處理
我們從視頻中採樣64幀的片段,然後對這些幀進行均勻採樣,以獲得16幀的模型輸入。在訓練過程中,我們使用了PyTorchVideo的MixVideo
來應用mixup/cutmix。
速度、大小、時間
[待補充]
評估
測試數據、因素和指標
測試數據
[待補充]
因素
[待補充]
指標
[待補充]
結果
我們僅對UCF101標註中的一個摺疊進行了訓練和評估。與VideoMAE論文不同,我們沒有對驗證視頻的多個裁剪/片段進行推理,因此結果可能略低於進行該操作時的結果。
- 評估準確率:0.758209764957428
- 評估前5準確率:0.8983050584793091
環境影響
可以使用Lacoste等人(2019)提出的機器學習影響計算器來估算碳排放。
- 硬件類型:[待補充]
- 使用時長:[待補充]
- 雲服務提供商:[待補充]
- 計算區域:[待補充]
- 碳排放:[待補充]
模型卡片作者
@nateraw
模型卡片聯繫方式
@nateraw
指標報告
這裡有一份WandB報告提供了相關指標。
表格目錄
- 模型詳情
- 用途
- 偏差、風險和侷限性
- 訓練詳情
- 評估
- 模型檢查(可選)
- 環境影響
- 技術規格(可選)
- 引用(可選)
- 術語表(可選)
- 更多信息(可選)
- 模型卡片作者(可選)
- 模型卡片聯繫方式
- 如何開始使用該模型
偏差、風險和侷限性
[待補充]
模型檢查(可選)
[待補充]
技術規格(可選)
模型架構和目標
[待補充]
計算基礎設施
硬件
[待補充]
軟件
[待補充]
引用(可選)
BibTeX
[待補充]
APA
[待補充]
術語表(可選)
[待補充]
更多信息(可選)
[待補充]