比人类还聪明?这种AI靠自学就会玩魔方,百分百成功且只需20步
人工智能已经能在很多方面胜过人类,比如下围棋、象棋、打扑克牌……近日,一种深度学习算法已经被开发出来,它可以比任何人更快地解魔方。
它从来没有失败过,达到了100%的成功率,而且可以把步骤控制在约20步。
人类可以打破人工智能18秒的纪录,世界纪录大约是4秒,但人类的效率要低得多,通常需要50步左右。
它是由加州大学欧文分校发明的。
这种新方法解决了计算机科学中的一个重要问题——如何使用这个名为DeepCube A的系统,在获得的帮助最小的情况下解决复杂的问题。
在《自然机器智能》(Nature Machine Intelligence)今天发表的一项研究中,研究人员证明,DeepCubeA能够100%解决所有测试问题,并在大约60%的时间里找到了通往目标状态的最短路径。
来自加利福尼亚大学的Pierre Baldi和他的同事们从之前的DeepCube项目中开发了DeepCubeA。
使用一种名为“自行迭代学习法”(autodidactic iteration)的新型深度学习技术,通过创建自己的奖励体系来自学。
Baldi教授说:“人工智能可以打败世界上最好的人类象棋和围棋选手,但一些更难的谜题,比如魔方,还没有被电脑破解,所以我们认为这些领域对人工智能的尝试是开放的。”
“魔方的解决方案涉及到更多的符号、数学和抽象思维,因此能够破解这样一个谜题的深度学习机器,正越来越接近成为一个能够思考、推理、计划和决策的系统。”
给定一个未解的多维数据集,机器必须确定特定的移动是否是对现有状况的改进。它通过结合强化学习和寻路的方法,在没有人类帮助的情况下解决谜题。
与传统算法相比,DeepCubeA使用更少的内存,能够在大多数情况下识别出谜题的最短路径。
作者表示,它可以解决魔方、熄灯游戏(Lights Out)、推箱子(Sokoban)和更大的问题,包括一个48片的滑动拼图。
经过训练后,网络使用一个标准的搜索树来搜索每个状况下的建议动作。
使用相同方法能解决的游戏范围很广,这意味着它可以用于更大的问题,以找到接近最优解。解决含有大量组合的谜题,也有助于帮助我们了解科学问题如何解决,比如蛋白质折叠。
魔方是一个创建于1974年的三维拼图游戏,它的目标是对齐魔方同一面上所有相同颜色的方块。
传统的算法可以解决谜题,但它们的计算能力和内存要求使得它们不适合像魔方这样的谜题。这是因为它们通常不能通过随机移动找出答案,而且很难从任何角度解出这个立方体。
核心算法的通用性表明,它可能具有超越组合谜题的应用,因为在规划、机器人和自然科学中,状态空间大、目标状态少的问题并不罕见。
这并不是人工智能第一次展示“超能力”。
此前,一台电脑在扑克比赛中击败了世界冠军中的五名选手。这是第一次在复杂的战略和计算游戏中,计算机击败了不止一个对手。
1996年,计算机首次在国际象棋比赛中击败了人类世界冠军,两年前,在更为复杂的中国战略游戏围棋中,更是如此。
但扑克带来了更大的挑战,因为它涉及到几位玩家。与国际象棋或围棋不同的是,计算机不能访问所有可用的信息,因为它看不到对手的牌。
这项研究发表在《自然机器智能》杂志上。
本文来自: 前瞻网