
早在2016年,一台超级计算机就能够在一款名为围棋的复杂棋类游戏中击败世界冠军。这是怎么可能的?这是如何做到的?
这是通过使用一种被称为强化学习(reinforcement learning)的人工智能(AI)来实现的,即计算机在被输入基本指令后自行训练。计算机从错误中不断学习,并逐渐变得非常强大。
强化学习的主要缺点是它不能应用于某些实际应用,这是因为当计算机在训练自己的时候,他们倾向于尝试几乎任何事情,然后最终得到正确的道路。
对于某些应用领域,如气候控制系统,在这种情况下,温度的突然变化是无法忍受的,这种初步的试错阶段可能会很棘手。
开车前先学习驾驶手册
瑞士电子与微技术中心(CSEM)的工程师们设计了一种新的方法来解决这个问题。他们证明,计算机在被编程学习现实系统之前,可以先在高度简化的理论模型上进行训练。这意味着,当计算机在实际系统上开始机器学习过程时,它们可以利用之前在模型上所学的知识来解决需要解决的问题。
因此,计算机可以迅速地走上正确的道路,而不会经历一段时间的极端变化。研究人员的研究最近发表在《IEEE神经网络与学习系统汇刊》上。
这就像在开车前先学习一下驾驶手册。通过这一预先的训练步骤,计算机建立了一个可以利用的知识库,这样它们就不会在寻找正确答案时盲目地试错。
该项技术可以使能源消耗减少20%以上
CSEM的工程师们在一座有100个房间的多层建筑的供暖、通风和空调(HVAC)系统上采用三相程序测试了他们的方法。
这个团队最初用一个“虚拟模型”来教计算机,这个模型是根据基本方程建立的,这些方程近似地定义了建筑物的模型。然后,他们将真实的建筑数据(天气状况、温度、百叶窗打开的时间等)输入计算机程序,使机器的训练更加精确和具有针对性。最后,他们允许计算机运行其强化学习算法,以确定处理暖通空调系统的最佳方式。
广泛的应用
这项最新发现可能会为机器学习的新前景铺平道路,因为它将更多地用于工作参数变化大、安全性或财务成本高的应用领域。