新生入学教育人智所专场博论
年清华大学计算机系新生入学教育—人智所专场暨“计算未来”博硕论坛期于年9月3日下午在FIT楼二层多功能厅成功举办。人工智能研究所所长刘洋老师、研究生代表王晨阳、陈冲、张帆同学和来自网易有道的孙艳庆博士带来了精彩的分享。
▲会场概况
▲刘洋老师
人工智能研究所所长刘洋老师向新生介绍了人智所的基本情况。人工智能研究所是科技部智能技术与系统国家重点实验室和清华大学人工智能研究院的主力军,研究方向分为基础理论、智能信息处理和智能控制三大领域,研究成果在国内外都产生了重大影响。同学们所熟知的九歌作诗、DeepMusic作曲等很多人工智能系统都诞生于计算机系人智所。刘洋老师提到了人智所对同学们的四点期望——志存高远、攻坚克难、勤学苦练、全面发展。
▲研究生代表王晨阳
王晨阳学长的研究方向是用户个性化动态推荐,这一问题在我们的日常生活中无处不在,但其背后却又很多值得研究的问题,比如用户意图伴随着行为、时间、场景的改变会有动态的变化。王晨阳学长深入浅出地介绍了他的两篇代表工作。首先,日常购物场景存在消费者重复购买相同商品的现象(repeatconsumption),但不同购买商品重复周期却有长有短(例如耐用品与快消品),同一商品用户购买意愿也会随时间改变。王晨阳学长结合统计传统方法和神经网络方法对不同商品的顾客重复购买意愿进行建模(Short-termandlifelongrepeatconsumptionmodel,SLRC),同时考虑到了商品的短期影响和长期影响。最终,SLRC在实验数据集上较前人研究重复消费的模型有了较大提升,实验结果也具有较好的可解释性。在第二篇工作中,王晨阳师兄将商品之间的关系(互补品与替代品)以及消费历史融入到了之前的模型中,将商品的BasicEmbedding和RelationEmbedding结合。该方法在Amazon商品推荐数据集上的实验结果证明,知识与历史信息的加入可以有效帮助模型提升精度。两篇工作分别发表在WWW和SIGIR上,并在github上开源了Pytorch版本的推荐系统框架。
▲研究生代表陈冲
陈冲学长重点介绍了他们提出的高效非采样方法(EfficientNon-samplingLearningTheorem)。传统非采样(Non-samplingLearningTheorem)复杂度大,不适用于神经网络训练;而负采样(NegativeSampling)的方法具备速度快的优点,但鲁棒性较差,且会让网络忽略掉一些关键样例。陈冲学长对传统的非采样方法进行了改进,大大提升了非采样方法的复杂度,该算法可以替代神经网络训练中的负采样方法,在推荐系统上可以极大提升模型效果与训练效率。该方法运用到不同场景下的推荐系统成果发表在AAAI、SIGIR、WWW等学术顶会上,得到极大的