我们通过实验证明,GNN调度器在不同的基准JSSP上的性能优于实际偏好的调度规则和基于RL的调度器,这是因为GNN调度器具有卓越的泛化能力。我们还证实,提出的框架学习了一种可转移的调度策略,该策略可以用于调度一个全新的JSSP(在大小和参数方面),而不需要进一步的培训。 1 介绍 调度策略学习考虑JSSP的固有结构,而不...
是一个结合GNN和预测的经典案例。虽然不是直接的车辆控制,但为理解多智能体交互提供了重要基础。
为了将对象级信息编码为潜在语义对象和运动视觉单词,作者首先通过图操作将对象级特征分别聚合为外观和运动特征。在Multiple Feature Extraction中,我们得到了对象级别区域特征,帧级别的动作和外观特征,然后作者构建了一个GNN来进行对象级别的交互(其中每个region都可以看做GNN中的一个node)。模型不只是依赖于局部区域特征,...
为了将对象级信息编码为潜在语义对象和运动视觉单词,作者首先通过图操作将对象级特征分别聚合为外观和运动特征。在Multiple Feature Extraction中,我们得到了对象级别区域特征,帧级别的动作和外观特征,然后作者构建了一个GNN来进行对象级别的交互(其中...
早期的视频字幕研究通常采用编码器-解码器框架,将视频字幕作为机器翻译任务。为了克服基于embedding的框架的缺点,图神经网络(GNNs)被用于建模对象之间的关系。然而,以往的GNN方法主要建立在对象特征上,而没有考虑整个视频序列中基于帧的时空上下文。 另一个挑战是,输出标题需要保持与内容相关的语法结构,而不是生成一个离...
早期的视频字幕研究通常采用编码器-解码器框架,将视频字幕作为机器翻译任务。为了克服基于embedding的框架的缺点,图神经网络(GNNs)被用于建模对象之间的关系。然而,以往的GNN方法主要建立在对象特征上,而没有考虑整个视频序列中基于帧的时空上下文。 另一个挑战是,输出标题需要保持与内容相关的语法结构,而不是生成一个离...