英国深度思维公司的人工智能体"阿尔法开发"(AlphaDev),已被证明能发现并改进C++(一种常用的计算机编程语言)库里广泛使用的计算机排序算法。《自然》7日刊登的这些人工智能(AI)生成的算法已被整合到C++排序库,这也是10多年来对这部分库作出的首次更改。研究团队使用"AlphaDev"进行改进探索。
算法对于计算是必不可少的,它能为执行特定计算任务提供一组指令。排序任务这类基础算法每天要运行数万亿次。由于人类专家无法进一步优化,改进这类算法的尝试遇到了瓶颈,而AI智能体有望解决这个问题。使用深度学习改进算法的努力一直受到限制,因为之前只能在开发深度学习系统的训练样本范围内进行发现和优化。"阿尔法开发"这种新的深度强化学习智能体被证明能突破这种限制,无需针对某个问题的任何训练就能发现新算法。
深度思维研究团队将寻找更优排序算法的任务编成了一个游戏,并训练"阿尔法开发"来玩这个游戏。通过玩这个游戏,"阿尔法开发"发现了超越当前最先进算法的排序算法。这次新发现的排序算法中有一些已与C++库的标准排序函数整合,这个系统有数百万名用户使用,包括许多大学和跨国公司。
"这种方法的优势在于这个系统能学习基于奖励信号生成高效程序,无需来自训练样本的任何指导。"美国麻省理工学院科学家阿曼多·索拉-勒泽玛在同时发表的新闻与观点文章中写道,"这种方法的通用性以及无需提前了解问题就能运行的能力使其成为一个关键进展,从而有望实现专家干预最小化的高效编程。"
来源:科技日报