学术动态
当前位置: 首页 > 学术动态 > 正文
国家天元数学西北中心“大模型数理基础研讨会”圆满举行
发布时间 : 2024-10-30     点击量:

10月28日至29日,由国家天元数学西北中心主办的“大模型的数理基础研讨会”在古城西安成功举行。此次研讨会引起了数学、力学、人工智能、信息科学等多个研究领域的专家学者的广泛关注。来自北京大学、清华大学、西安交通大学、上海交通大学、浙江大学、武汉大学、大连理工大学、中国科学院数学与系统科学研究院、国防科技大学、中国科学院国家空间科学中心等七十余所高校、企业及科研院所的300余名专家学者齐聚一堂,共同探讨大模型的数理基础难题。


28日上午,会议邀请国家天元数学西北中心主任、西安交通大学徐宗本院士出席开幕式并致辞。徐院士对远道而来的专家学者表示热烈欢迎,并阐述了大会的背景和意义。他讲到,随着人工智能的兴起,数学与人工智能的结合已成为数学领域研究的重要部分,数学如何切入主流并发挥其作用,尤其是在大模型中提供支撑,是数学学者需要思考的问题。他鼓励与会学者要勇于跨越学科边界,尝试不同角度的探索,以解决大模型在实际应用中遇到的复杂问题。随后,西安交通大学孟德宇教授作为会议的召集人,作了引导发言。他从统计学习的角度剖析了现代大模型的基础理论与算法问题,强调了数理基础问题研究的必要性与紧迫性,希望通过会议梳理当前大模型数理基础难题,研讨提出攻关路径。 

在大会报告环节,徐宗本院士提出了一个数学框架和理论来解析大模型的智能涌现问题,为理解大模型的新特征/新行为提供了新的视角。大连理工大学的郭旭院士分享了智算力学的最新研究进展,探讨了其中的核心数学问题,为力学与人工智能的深度融合提供了新的理论支撑。中国科学院数学与系统科学研究院的高小山研究员探讨了“On the Generalization and Security of Memorization Neural Networks”。南方科技大学的荆炳义教授关注大模型训练中的数据筛选问题,提出了从底层训练框架出发,重新设计数据在训练过程中的生命周期,以提高模型性能。

 

除了大会报告,研讨会还包括了九场特邀报告。香港中文大学(深圳)的孙若愚副教授讨论了大型语言模型训练算法的理解和提升,提出了一些新的优化方法。宁波诺丁汉大学的邱国平教授作了题为“Improving Mental Health and Well-being through Beautiful Imaging”的报告。北京大学的贺笛助理教授则围绕神经网络的表达能力,探讨了生成式语言模型的表达能力上限。上海交通大学的许志钦副教授,西安交通大学的陈志平教授、贾骏雄教授、束俊副教授和古祥助理教授也分别就现象驱动理解语言模型的推理与记忆、强化学习的模型与数学理论、无限维贝叶斯推断方法、模拟学习方法论以及Transformer的数学理解与多模态对齐大模型的最优传输方法等议题,同与会学者们进行了深入的探讨。

此次研讨会的成功举办,不仅为数学、力学、人工智能、信息科学等领域的专家学者提供了一个分享新知识、交流新思想和探讨新方法论的重要平台,也有助于为人工智能的未来发展提供必要的数学理论支持和技术指导,推动人工智能技术的创新和应用。 

 

陕西省西安市碑林区咸宁西路28号     西安交通大学数学与统计学院

邮编:710049     电话 :86-29-82668551     传真:86-29-82668551