模型预测未来3秒的轨迹,输入图像大小为1280 × 720,使用ResNet50提取特征,BEV查询、边界框和地图点数量分别为200 × 200、200和100 × 20。训练使用AdamW优化器,学习率分三个阶段调整,最终模型在PyTorch框架下用8张NVIDIA RTX A6000显...