ASPLOS 2023有哪些值得关注的论文?*Heron: Automatically Constrained High-Performance Library Generation f...
近日,阿里云机器学习平台PAI和上海交通大学冷静文老师团队合作的论文《图神经网络统一图算子抽象uGrapher》被ASPLOS 2023录取。 为了解决当前图神经网络中框架中不同的图算子在不同图数据上静态kernel的性能问题,uGrapher通过将所有图算子抽象为统一的中间表达形式,解耦图算子的计算和调度,并定义了在GPU上优化图算子的设计...
ASPLOS'23 系统顶会论文解析:Plugsched:安全高效的多场景调度器热升级阿里云基础软件/达摩操作系统实验室的研究成果,"Efficient Scheduler Live Update for Linux Kernel with Modularization",已在2023届28届 Architectural Support for Programming Languages and Operating Systems (ASPLOS'23) 上荣登长论文...
简介:近日,阿里云机器学习平台PAI和上海交通大学冷静文老师团队合作的论文《图神经网络统一图算子抽象uGrapher》被ASPLOS 2023录取。 近日,阿里云机器学习平台PAI和上海交通大学冷静文老师团队合作的论文《图神经网络统一图算子抽象uGrapher》被ASPLOS 2023录取。论文通过抽象统一的的高性能图算子接口来自适应探索它们在不同...
GRACE: A Scalable Graph-Based Approach to Accelerating Recommendation Model Inference 要解决的问题是深度推荐模型(DLRM)在inference过程中的性能瓶颈,尤其是内存带宽不足导致的latency和throughput问题。随着DLRM模型越来越大,离散embedding数量增多,问题变得更为复杂。现有解决方案或没有充分考虑CPU+GPU的...
这次提交的关于香山的论文最先发表于2022年MICRO上,然后提交到Top Picks。从评审结果来看,很高兴国际学术界对香山的高度认可——8位评审人中有5位给出了最高分,3位给出次高分。评审人的评语也给我们极大的鼓舞,比如认为香山及其敏捷开发方法将会“have a substantial positive impact”,“have a long-term impact ...
近日,阿里云机器学习平台PAI主导的论文《图神经网络统一图算子抽象uGrapher》被ASPLOS 2023录取。论文通过抽象统一的的高性能图算子接口来自适应探索它们在不同图数据集上的最佳并行执行策略, 这是首个在图神经网络上利用自适应的并行策略,在不同图数据和不同图算子中探索高性能计算优化的研究工作。
近日,阿里云机器学习平台PAI和上海交通大学冷静文老师团队合作的论文《图神经网络统一图算子抽象uGrapher》被ASPLOS 2023录取。论文通过抽象统一的的高性能图算子接口来自适应探索它们在不同图数据集上的最佳并行执行策略, 这是首个在图神经网络上利用自适应的并行策略,在不同图数据和不同图算子中探索高性能计算优化的...
感兴趣的速速投简历 | 哈工大深圳计算机2025博士急招,导师施少怀教授,2022年入选国家级青年人才计划,“鹏城孔雀计划”特聘岗位B档。2020年在香港浸会大学获得博士学位,2020-2022年在香港科技大学计算机科学与工程系任研究助理教授。研究兴趣为机器学习系统和高性能计算,在相关领域共发表文章40余篇,包括TPDS、ASPLOS、...
提高DLRM上离散embedding的带宽问题这几年形成了一波小热点,从19年mlsys,vldb等有多篇论文研究过这个...