在北大,林宙辰老师开始接触 AI,初步学习了图像处理和模式识别,也参与了若干实际项目,其中一个项目就是搭建地理信息系统,把手绘地图或印刷地图数字化并进行管理。通过这些课程和项目,林宙辰老师体会到了 AI 的魅力。 1995 年,林宙辰老师从北大数学系硕士毕业后,远赴香港,在香港理工大学应用数学系,又进行了为期两年的硕士学习,掌握了计算数学的基础
因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新性的方案。经实验验证,其性能远超 Mixtral、Mamba 和 Jamba。论文已在 European Conference on Artificial Intelligence (ECAI) 2024 上发表。论文标题:MixCon: A Hybrid Architecture for Efficient and Adaptive Seq...
为了解决这个问题,北京大学林宙辰教授团队提出了一种易于操作的基于优化算法设计具有万有逼近性质保障的神经网络架构的方法,其通过将基于梯度的一阶优化算法的梯度项映射为具有一定性质的神经网络模块,再根据实际应用问题对模块结构进行调整,就可以系统性地设计具有万有逼近性质的神经网络架构,并且可以与现有大多数基于模...
机器之心专栏 。以神经网络为基础的深度学习技术已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,稳定网络训练,提高计算效率。目前,…
今年,ACM共评选出56位杰出会员(Distinguished Member),表彰他们在计算机领域的影响力。所有2024年入选者都是这个著名学术团体的注册会员,他们因在技术成就方面的突出表现,以及对专业社区的志愿服务而被同行选中。作为全球最大的计算机学会,ACM拥有超11万名会员。而全世界能够获得「杰出会员」称号的,不超过全体会员...
在自然语言处理、语音识别和时间序列分析等众多领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。 因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新性的方案。经实验验证,其性能远超 Mixtral、Mamba 和 Jamba...
北大林宙辰团队提出全新混合序列建模架构MixCon ©作者 |林宙辰、徐鑫 单位|北京大学 来源|机器之心 因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新性的方案。经实验验证,其性能远超 Mixtral、Mamba 和 Jamba。论文已在 European Conference on Artificial ...
MixCon 作为创新的混合序列建模架构,通过整合多种技术,在处理复杂动态序列时具有高效的计算效率,在各项任务中展现出显著优势,能高效处理长序列、内存使用低且吞吐量高,具有高可扩展性和实用性。 在自然语言处理、语音识别和时间序列分析等众多领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和...
好消息!好消息!10月20日 中国计算机学会发布 2020年度“CCF科学技术奖”评选结果公告 永泰籍北大教授林宙辰领衔的课题组 获得2020年CCF科学技术奖自然科学一等奖 该研究是有关人工智能的 “CCF科学技术奖”授予在计算机科学、技术或工程领域具有重要发现、发明、原始创新,在相关领域有一定国际影响的优秀成果。简言之 ...
目前,北大的科研条件较之前又有了进一步的改善,非常有利于青年教师发展。 熊宇轩:许多博士毕业之后会选择谋求高校的教职,许多高校对青年教师都有较高的科研考核压力,请问林老师认为青年教师应该如何平衡科研和教学? 林宙辰:对于我自己组内有志于谋求高校教职的同学,我一般会建议他们去尽可能排名高的学校。这样,他们会...