清华计算机系杨宗瀚本科即2篇顶会一作交

北京最佳酒渣鼻医院 http://pf.39.net/bdfyy/bdfzd/210310/8733705.html
第37届国际机器学习大会(ICML)即将在下周召开。作为全球最具影响力的机器学习学术会议之一,其收录的论文也代表了该领域前沿的最新进展。由于近年来机器学习领域竞争激烈,投稿数量逐年攀升。据统计,ICML共收到份投稿,但最终仅收录篇,接受率为21.8%,近三年接受率也是呈逐年走低趋势。而今年刚刚从清华大学计算机系本科毕业的杨宗瀚,就有一篇论文发表在ICML上,其标题为《残差和非残差网络的插值》(InterpolationbetweenResidualandNon-ResidualNetworks)[1]。杨宗瀚今年秋季将在清华大学计算机科学与技术系直博,进入自然语言处理与社会人文计算实验室,师从刘洋教授。

图杨宗瀚(图片来源:杨宗瀚)

“我们尝试提出了一种新的常微分方程模型,这种模型可以同时建模残差和非残差网络,离散化处理得到的插值网络可以在准确率和鲁棒性间取得更好的平衡。”杨宗瀚说。他是这篇论文的第一作者。神经常微分方程是近年来深度学习领域中的热点方向,相关论文曾在年获得神经信息处理系统大会(NeurIPS)最佳论文奖[2]。这项研究富有创新性地将残差网络与微分方程数值格式对应起来,进而将有限的离散层神经网络和无限的连续常微分方程联系起来。但与前人工作不同的是,在杨宗瀚等人的工作中,他们的神经常微分方程模型由于阻尼项的存在,因而不依赖于残差连接,进而实现了同时对残差和非残差网络的建模。

从机器作诗到神经常微分方程

其实,杨宗瀚最初接触科研是从自然语言处理开始的,他参与的第一个科研项目与机器作诗有关。如果你对古诗词感兴趣,或许你听说过“九歌”[3]。不过,这里的“九歌”不是《楚辞·九歌》,而是由孙茂松教授领导研发的可以作诗的人工智能。“九歌”曾在央视节目《机智过人》中与人类同台作诗,且成功淘汰了一些人类所作的作品。在提及“九歌”的工作原理时,杨宗瀚是这样解释的:机器作诗最主要的原理是序列到序列学习(sequence-to-sequencelearning)。比如,给定诗的第一句,想要生成第二句,便是使用编码器-解码器(encoder-decoder)的架构,将第一句“翻译”成第二句。这种架构最主要的应用场景是机器翻译,相关论文所做的实验也大多和机器翻译相关。参与这个项目之后,杨宗瀚开始


转载请注明:http://www.aierlanlan.com/tzrz/337.html