H

Hpt Base

由liruiw開發
HPT是一種將不同實體對齊到共享潛在空間的變換器模型,專注於策略學習中的擴展行為研究。
下載量 70
發布時間 : 4/11/2024

模型概述

異構預訓練變換器(HPT)通過將不同實體對齊到一個共享的潛在空間,研究策略學習中的擴展行為。它可以在策略中間放置一個可擴展的變換器,而無需從頭開始訓練。

模型特點

異構實體對齊
能夠將不同的實體對齊到一個共享的潛在空間
策略學習擴展
研究策略學習中的擴展行為,無需從頭訓練
可擴展變換器
在策略中間放置可擴展的變換器,提高模型靈活性

模型能力

異構實體對齊
策略學習擴展
機器人控制策略優化

使用案例

機器人技術
機器人策略學習
用於機器人控制策略的學習和優化
無需從頭訓練即可實現策略擴展
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase