报告人:张俊杰副研究员,西北核技术研究院
报告时间:2024年9月10日,上午9:30
报告地点:数学楼2-2会议室
报告题目:现代神经网络的量子力学本质
报告摘要:
神经网络作为黑盒系统取得了巨大的成功,不过,大量实验研究表明,高精度的神经网络更容易被攻击,且高时间分辨率的自回归系统会面临难以控制的累积误差。针对这些现象,我们通过借鉴量子力学的数学工具,通过将神经网络的损失函数归一化为波函数,定义波包、量子、不确定关系,证明了神经网络系统的量子本质。并利用神经网络不确定原理解释了网络的脆弱性本质和梯度解耦特点,为神经网络安全和生成式AI设计提供了理论借鉴。在此基础上,我们进一步通过Ising模型的副本对称破缺原理,给出了现代神经网络的优化方向。
个人简介
张俊杰,现为西北核技术研究所副研究员,博士毕业于火箭军工程大学(中国科学技术大学联合培养)。长期从事基于GPU集群的碰撞等离子体模拟与智能科学计算(AI for Science)相关工作,在National Science Review, Computer Physics Communications, Physical Review D等期刊发表论文25篇,先后主持国家自然科学基金、某部等项目。
代表性工作包括:
1.基于大型GPU集群的玻尔兹曼-麦克斯韦耦合方程计算框架RBG-Maxwell,用于描述物理边界开放的碰撞等离子体系统,相关工作被国内外同行引用200余次,被领域内重要综述文章,如[Annual Review of Nuclear and Particle Science, Vol. 70: 395-423, Progress in Particle and Nuclear Physics, Vol. 127, 103989]等引用,并在领域内最高会议Quark Matter上做报告。
2.基于混合模拟方法的碎片云等离子模拟,揭示了高空核爆碎片云等离子体系统的非线性特性,是国内首份公开的关于碎片云等离子体演化的文献,受到了包括法国原子能和替代能源委员会高级顾问Claude Guet教授等专家的高度关注。
3.神经网络不确定原理与副本对称破缺机制。从理论上证明神经网络的量子本质是其内禀属性,为理解神经网络提供了一种前所未有的跨学科视角,相关论文发表在National Science Review上。
邀请人:王飞教授