smart_tv_hand_gestures_image_detection開源模型 - 精準識別智能電視9種常見手勢

首頁

Smart Tv Hand Gestures Image Detection

由dima806開發

基於Vision Transformer架構的智能電視手勢識別模型，能夠準確分類9種常見手勢。

圖像分類

Transformers

開源協議:Apache-2.0 #智能電視手勢識別 #高精度圖像分類 #Vision Transformer

下載量 65

發布時間 : 1/30/2025

模型概述

該模型使用ViT架構實現智能電視場景下的手勢識別，可識別包括滑動、停止、拇指方向等9類手勢，準確率達99.9%。

模型特點

高精度識別

在測試集上達到99.9%的整體準確率，所有手勢F1值均超過99.5%

多手勢支持

支持9種常見智能電視手勢的精確分類

高效架構

基於Vision Transformer的現代視覺架構，平衡性能與效率

模型能力

圖像分類

手勢識別

即時動作檢測

使用案例

智能家居

電視手勢控制

通過攝像頭捕捉用戶手勢實現無遙控器操作

準確識別9種控制手勢，誤識別率<0.1%

無障礙交互

特殊人群控制界面

為行動不便用戶提供非接觸式交互方案

屬性	詳情
評估指標	準確率、F1值
基礎模型	google/vit-base-patch16-224-in21k
任務類型	圖像分類
庫名稱	transformers

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Smart Tv Hand Gestures Image Detection

模型概述

模型特點

模型能力

使用案例

🚀 智能電視手勢圖像分類模型

🚀 快速開始

分類報告

📄 許可證

📋 模型信息