Comparison of a discrete CQL-SAC implementations vs the normal discrete SAC.CartPoleLunarLanderOffline RL Results:ResultsFind all training results and hyperparameter in the wandb project.TODO:update readme [ ] add distributional Q-Function [ ]
High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC - tinkoff-ai/CORL
男:儿女们都会 躲到一边 女:你养儿女呢啊 应该应份啊 男:儿女们养你 那可有点难 女:你有钱儿女们花 欢天喜地啊 男:你要是花儿女们钱 惹出祸端 女:儿女们有事啊 你还得管啊 男:你要是有事了 他们不发言呐 女:你要是能干活 说话还管用啊 男:干不动活了 说话惹人烦 女:没事了儿女们 把猫狗...