T

Tqc PandaPickAndPlace V1

Developed by sb3
這是一個基於TQC算法的深度強化學習模型,專為PandaPickAndPlace-v1環境設計,用於機械臂抓取和放置任務。
Downloads 14
Release Time : 6/2/2022

Model Overview

該模型使用TQC算法訓練,適用於機械臂的抓取和放置任務,能夠學習複雜的操作策略。

Model Features

基於HER的樣本高效學習
使用HER (Hindsight Experience Replay)技術,提高了在稀疏獎勵環境中的學習效率。
多目標策略
能夠處理多目標強化學習任務,適應不同的抓取和放置場景。
穩定訓練
採用TQC算法,通過截斷分位數迴歸提高訓練穩定性。

Model Capabilities

機械臂控制
物體抓取
物體放置
強化學習任務解決

Use Cases

工業自動化
生產線物品分揀
在自動化生產線上進行物品抓取和分類放置
平均獎勵-12.90±8.87
機器人研究
機械臂操作研究
用於研究機械臂的精細操作能力
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase