11月29日,由中国仿真学会装备运用实验与训练仿真专业委员会承办的"智能博弈与建模仿真"分论坛召开,北京航空航天大学张霖教授、中科院自动化所赵冬斌研究员、国防科技大学牛轶峰教授、航天五院五〇二所刘潇翔研究员、北京华如科技股份有限公司张柯博士、第四范式副总裁涂威威、白杨时代彭鹏博士7位专家进行了精彩的主题报告,来自军队院校、科研院所、国防工业企业等单位50余名专家学者出席了会议,张柯博士担任分会场主持人。
(张柯博士担任分会场主持人)
(会场专家学者云集)
北京航空航天大学张霖教授作了《面向智能制造系统的建模仿真技术》的学术报告。随着新一代信息技术、人工智能技术的进步,制造系统正逐步发展为数字化、网络化、智能化的虚实融合的复杂系统,针对这类系统的设计、分析、运行、维护等全生命周期,对建模仿真技术的需求甚至依赖越来越强烈。报告介绍了建模仿真技术在智能制造系统各个阶段的应用情况,简述了制造仿真技术的发展历程和对制造业发展的重要作用,针对制造单元仿真技术、制造集成仿真技术和制造智能仿真技术介绍相关的研究和应用进展,特别是针对面向新一代智能制造的智能仿真技术的内涵和研究进展。
(张霖教授作学术报告)
中科院自动化所赵冬斌研究员作了《基于深度强化学习的智能博弈》的学术报告。计算机博弈,被誉为人工智能领域的"果蝇"。近年来,深度强化学习方法摘取了计算机博弈领域的一项项桂冠,包括下围棋的AlphaGo,打星际争霸的AlphaStar等等,成为人工智能方向的主流方法之一。报告首先介绍了深度强化学习方法及其发展历程,展开所在团队基于深度强化学习方法在游戏AI和机器人对抗等智能博弈领域的研究工作,最后给出智能博弈领域的发展趋势。
(赵冬斌研究员作学术报告)
国防科技大学牛轶峰教授作了《无人机系统发展与集群感知技术》的学术报告。无人机系统的发展是需求牵引和技术推动的典型代表,先后经历了无人靶机—侦察型无人机—一次性使用攻击型无人机—察/打一体化无人机到作战型无人机的发展历程,其使命由早期的靶标、情报/监视/侦察、电子软/硬杀伤发展到察/打一体乃至智能化作战任务,涵盖对地、对海乃至对空作战等任务。当前,无人机系统呈现出高能化、智能化、体系化发展态势。报告首先回顾了无人机系统的发展历程和发展趋势;然后,针对无人机系统在侦察任务中的规模化使用,需要解决的无人集群感知等问题,探讨了其关键问题和解决方案。
(牛轶峰教授作学术报告)
航天五院五〇二所刘潇翔研究员作了《基于数字孪生的航天器智能操控与健康管理技术》的报告。航天器控制系统自主健康管理和智能操控运维技术,是实现未来大规模星群、在轨服务操控等复杂任务的核心关键。面向航天器复杂的对象特性、任务特征及运行环境,建设从产品级到系统级的数字孪生系统,将模型和知识嵌入到数字孪生系统的框架和流程中,依靠地面数字化仿真高度拟合在轨飞行状态,利用数字孪生系统与地面物理试验系统、在轨飞行试验系统之间的平行映射关系,实现多源异构数据无缝、准确、在线的多向流通,以数字孪生和人工智能技术为航天器控制系统赋能,在时间(全生命周期)和空间(地面与在轨)上实现平行交互修正、平行运维支持、平行感知识别、平行操控引导。
(刘潇翔研究员作学术报告)
第四范式副总裁涂威威作了《数据驱动的模拟仿真与决策优化技术:环境学习与强化学习》的学术报告。模拟仿真是物流调度、生产制造、科学研究等众多领域解决复杂问题的重要基础。传统的模拟仿真技术强烈依赖于人类专家对系统机理的精确理解,然而,复杂的业务系统中往往存在一些不可观测量,同时,人类专家也很难对多变的复杂系统及时总结出足够复杂以及精确的有效规律用作模拟仿真。另外,复杂的业务系统往往存在大量且复杂的决策变量,很多业务系统需要连续决策,决策结果往往只能延迟反馈,这些复杂因素使得传统的基于运筹学的优化技术无法有效解决复杂业务系统的决策优化问题。数据驱动的人工智能技术的发展,为上述模拟仿真与决策优化问题提供了新的解决思路,本次报告将分享第四范式在这些方面的思考与探索。
(第四范式副总裁涂威威作学术报告)
白杨时代彭鹏博士作了《基于大规模自学习的博弈决策智能体》的学术报告。大规模自学习技术又称为强化学习技术,是一项当今国际上最先进的决策智能技术。通过与环境不断交互产生数据,智能体实现自我学习和进化,持续提高其博弈决策水平。继2016年AlphaGo一战成名之后,美国多个人工智能公司和研究机构在包括德扑、Dota2以及AlphaStar等多个典型博弈场景中持续验证自学习技术的可行性。国内专注博弈推演决策的公司白杨时代近年来也将该技术应用于相关领域,并取得多项成果。报告分享了白杨时代在炸弹人多智能体竞赛和星际争霸2这两个典型场景中对该技术的研究和应用,介绍包括大规模自学习技术的架构设计,强化学习算法优化,博弈决策神经网络构造,智能体训练方法在内的多个关键技术最新应用成果。
(彭鹏博士作学术报告)
北京华如科技股份有限公司张柯博士作了《AI在作战仿真中的实践思考》的报告。作战仿真是典型的复杂系统仿真,各级各类决策行为是作战仿真的核心,亦即人工智能一直都是作战仿真的核心。作战仿真中广泛采用DES、ABMS、MAS方法包含了对行为决策的建模仿真支持,目前主要采用的是基于知识的方法,包括脚本、状态机、行为树等规则方法。数据驱动的人工智能能否、何时能成为未来作战仿真的行为建模技术还没有确定的答案,知识驱动的方法还有没有应用和拓展的空间是一个值得深入思考的问题。报告以近年来在作战仿真中的人工智能实践工作为主,包括知识驱动、数据驱动的方法所取得的成果和发现的问题,当前尝试将两者进行结合所采用的方法、技术途径以及遇到的困难。
(张柯博士作学术报告)