trajectory-ranked+reward+extrapolation

2025-01-17 03:03:57

拼音 [ 拼音 ]

MA-TREX: Mutli-agent Trajectory-Ranked Reward Extrapolation...

Reward extrapolationIterative extrapolationKnowledge transferTrajectory-ranked reward extrapolation (T-REX) provides a general framework to infer users' intentions from sub-optimal demonstrations. However, it becomes inflexible when encountering multi-agent......