"人工智能的基石是数学,没有数学基础科学的支持,人工智能很难行稳至远。" 在中国科学院院士、西安交通大学教授徐宗本看来,目前人工智能所面临的一些基础问题,其本质是来自数学的挑战。
近日,由联合国教科文组织和中国工程院联合主办的以"大数据与知识服务"为主题的联合国教科文组织国际工程科技知识中心2019国际高端研讨会上,徐宗本在题为《AI与数学:融通共进》的主题报告上如是说。
数学家眼里的人工智能是什么?徐宗本给出的答案简洁明了:当下主要指机器学习。
如果给这个名词赋予一个说明,他认为这是人或者智能体,通过与环境的交互来提升自身行为和解决问题能力的智能化操作。"机器学习是把这种智能形式化为数学公式,转换成计算机可以操作的算法和软件。"进一步说,人工智能实际上是一个将数学、算法理论和工程实践紧密结合的领域。将其扒开来看,就是算法,也就是数学、概率论、统计学、各种数学理论的体现。不过徐宗本认为,作为人工智能基石的数学,还存在五大核心问题待解,而这也是制约人工智能进一步发展的"绊脚石"。
第一是大数据的统计学基础。徐宗本认为,人工智能和大数据是一对孪生姐妹。人工智能更多指应用模式,强调与领域知识的结合。大数据是最底层的信息技术,強调机器和机器、机器与人之间的内容交互与理解。但是当前,分析大数据的统计学基础面临颠覆,应用于复杂大数据分析的极限理论、统计推断方法、真伪判定等数学基础都尚未完全建立起来。
第二是大数据计算基础算法。一般而言,理解和分析大数据都是通过数据处理或数据分析来实现的,而无论是数据处理还是数据分析最终都化归到求解一系列基本的数学问题,像线性方程组求解、图计算、最优化计算、高维积分等。不过,这些看似早已解决的问题在大数据情形下却成了"拦路虎"。为此,他以旅游为例,打了一个生动的比方来解释这种挑战。"比如从西安到北京,怎么走最近?过去地图分辨率不高,根据普通的地图可以获取基本的路线。但现在大数据背景下地图的分辨率越来越高,不可能一次就给你涵盖西安至北京之间全部城市与道路的数据,只能一次一次地分别给其中某些城市之间的道路信息。如何在西安就知道到达北京需要多少时间,怎样走最近?要带多少钱? 现在的机器还回答不了这些问题。这就是由于分布式图信息环境下图计算基础算法没有解决的原因。"
第三是深度学习的数学理论。徐宗本认为,这个问题在当下尤为关键。新一轮的人工智能多以深度学习为基本模型,然而深度学习的设计基础在哪?什么样的结构决定了什么样的性能?能不能有台劳公式和富里埃级数这样的数学表示理论?这些基本的理论问题还没有解决。正是这个原因,现在的人工智能还得靠"人工"来换"智能",这也是造成当下"人工智能=人工+智能"的缘由。
第四是非常规约束下的最优输运。人工智能的很多问题都可归纳为两个领域数据打通问题,即让两个对象在满足某一个特定的不变量情况下互相转移。"比如中英文互译,它就是在保持语义的情况下将中文数据转换成英文数据。" 如果应用到现实,徐宗本畅想,将医院的CT和核磁共振图像相互转移或能很好地解决医疗诊断的信息不足问题。"因为照的是同一个人,这里人就是不变量。要解决这些问题,建立特定约束下如何实现最优传输的数学理论与方法是基本的。"
第五是关于学习方法论的建模与函数空间上的学习理论。徐宗本表示,研究生阶段学到的机器学习理论,需上升到学习方法论学习的阶段。"从数学上说,无论函数空间上的学习理论怎么建立,本质是要适应不同的任务。由于任务本身是函数,是无穷的,那么就需要把过去机器学习中对样本、数据的选择、泛化,推广到对任务的选择、泛化上去。"如果辩证地看待数学和人工智能的关系,相辅相成可能是其最好的诠释。徐宗本表示,不仅数学可为人工智能提供基础,人工智能也为数学研究提供新的方法论。"比如解偏微分方程,过去人们可能会使用计算机,现在用人工智能可以做的更好。" 他认为,让数学中的模型方法与人工智能的数据方法结合,可将机器的深度学习应用得更加精明。
面对如今发展如火如荼的人工智能产业,这位院士也给出了自己对从业者的希冀。"人工智能想要做得好,要靠数学问题尤其是算法的解决。"徐宗本再次强调,从业者应潜心从基础研究抓起,使我国的应用场景优势真正转化为技术优势和产业优势。
来源:科学网