报告人:张耀宇副教授,上海交通大学
报告时间:2024年10月27日,下午15:00—16:00
报告地点:数学楼2-2会议室
报告题目:神经网络样本效率的乐观估计
报告摘要:估计神经网络的样本效率,即拟合目标函数所需的样本量,是深度学习理论中的一个重要问题。实验表明,传统的基于最差情况的样本量估计显著低估了神经网络的实际性能。为了克服传统估计的局限性,我们提出了一种乐观估计方法,用于定量估计最佳可能情况下的样本效率。我们的实验表明,样本效率的乐观估计能够定量地反映模型的实际性能。对于神经网络模型,我们的乐观估计表明,通过增加网络的宽度以提高参数量不会损害神经网络的样本效率。然而,通过增加(非必要的)连接来提高参数量则会显著损害样本效率。我们的分析为实践中普遍采用增加宽度、而较少增加连接的规模扩张策略提供了理论依据。
个人简介:
上海交通大学自然科学研究院/数学科学学院长聘教轨副教授。2012年于上海交通大学致远学院获物理学士学位。2016年于上海交通大学获数学博士学位。2016年至2020年,分别在纽约大学阿布扎比分校&柯朗研究所、普林斯顿高等研究院做博士后研究。他的研究聚焦于深度学习的基础理论,相关论文发表于JMLR、SIMODS、NeurIPS等期刊和会议。他的研究获得了上海市海外高层次人才计划和临港实验室求索杰出青年计划的支持。
邀请人:王飞教授