今年的MLSys大会在8月28日到9月1日在圣克拉拉召开,作为机器学习系统领域的新兴会议,吸引了众多学术界和工业界的研究者前来参加。这次有幸来到圣克拉拉和各位同行前辈们学习交流,实在是难得的机会。我会在接下来…
ML compilers and runtime Programming languages for machine learning Visualization of data, models, and predictions Specialized hardware for machine learning Hardware-efficient ML methods Machine Learning for Systems Systems for Machine Learning Important Dates Conference Sessions Mon Apr 11th through Thu the...
[2] Zhen Zheng, Xuanda Yang Pengzhan Zhao, Guoping Long,Kai Zhu, Feiwen Zhu, Wenyi Zhao, Xiaoyong Liu, Jun Yang, Jidong Zhai, et al. AStitch: Enabling a New Multi-dimensional Optimization Space for Memory-Intensive ML Training and Inference on Modern SIMT Architectures. ASPLOS 2022. [3]...
[NeurIPS 2022] "FedRolex: Model-Heterogeneous Federated Learning with Rolling Sub-Model Extraction" by Samiul Alam, Luyang Liu, Ming Yan, and Mi Zhang - GitHub - AIoT-MLSys-Lab/FedRolex: [NeurIPS 2022] "FedRolex: Model-Heterogeneous Federated Learning w
并在一些关键性能上大幅超越XLA,具体的论文的介绍参见:【MLSys 2022】论文介绍:图算融合Apollo:-基于...
尤其欢迎对图神经网络感兴趣的同学,DGL 团队同 AWS 北美合作也很多,在北美的同学也可以就近投简历。 MLSys 2023 Call for Papers! 会议将在明年六月在怡人的迈阿密海滩边[3]举办,截稿时间在这个月底,有合适工作的同学敬请关注! 参考 ^MLSys 2022 参会评述随笔https://zhuanlan.zhihu.com/p/559385274 ^...
Virtual Sitemlsys.org/virtual/2022/calendar 注:后两天的大会报告总计7个Session,论文在Diversity上更强,为了避免班门弄斧,这次不会一一介绍。只挑选了部分工作进行展开,后面如果有时间再来补充。如果遗漏了某些重要工作,还请见谅! Day 2 1. Sustainable AI: Environmental Implications, Challenges and Opportunitie...
2022年11月5日更新 3 SAR SEQUENTIAL AGGREGATION AND REMATERIALIZATION: DISTRIBUTED FULL-BATCH TRAINING OF GRAPH NEURAL NETWORKS ON LARGE GRAPH Intel AI lab 摘要 1. Sequential Aggregation and Rematerialization(SAR) 在backward pass中顺序地重新构建并释放大型GNN计算图的碎片。
如果大家仔细看深度学习编译器文章的引用的话,会发现很多人都会acknowledge一个工作叫ATLAS,这个工作就是2022年图领奖得主Jack Dongarra的作品。ATLAS做的事情就是自动化生成BLAS库,通过使用硬件高度相关调优的routines,以及通过参数化tiling factor, cache size等控制代码生成,这个过程会使用之前准备好的高性能routines。
并在一些关键性能上大幅超越XLA,具体的论文的介绍参见:【MLSys 2022】论文介绍:图算融合Apollo:-基于...