进化机器人(Evolutionary robotics ER)是一种使用进化计算为自动机器人开发控制器和/或硬件的方法。ER中的算法经常对候选控制器的群体进行操作,最初从一些分布中选择。然后根据适应度函数重复修改该群体。在遗传算法(或“GAs”)(进化计算中的常用方法)的情况下,候选控制器的群体根据交叉,变异和其他GA算子重复生长,然后根据适应度函数进行剔除。ER应用中使用的候选控制器可以从人工神经网络集的某个子集中提取,尽管有些应用程序(包括SAMUEL,在海军人工智能应用研究中心开发的“使用”如果那么“规则”作为单个控制器的组成部分。理论上可以使用控制律的任何一组符号表达式(有时称为机器学习社区中的策略)作为可能的候选控制器的空间。人工神经网络也可用于进化机器人技术之外的机器人学习。特别是,其他形式的强化学习可用于学习机器人控制器。理论上可以使用控制律的任何一组符号表达式(有时称为机器学习社区中的策略)作为可能的候选控制器的空间。人工神经网络也可用于进化机器人技术之外的机器人学习。特别是,其他形式的强化学习可用于学习机器人控制器。理论上可以使用控制律的任何一组符号表达式(有时称为机器学习社区中的策略)作为可能的候选控制器的空间。人工神经网络也可用于进化机器人技术之外的机器人学习。特别是,其他形式的强化学习可用于学习机器人控制器。
发展机器人与进化机器人相关,但不同。ER使用随着时间推移而发展的机器人群,而DevRob对于单个机器人控制系统的组织如何随着时间的推移通过经验发展感兴趣。
历史
ER的基础是在90年代在罗马的国家研究委员会工作,但最初的想法是将机器人控制系统编码到基因组中并进行人工进化改进可以追溯到80年代后期。
在1992年和1993年,三个研究小组,一个围绕洛桑的EPFL的Floreano和Mondada,另一个围绕来自苏塞克斯大学的COGS的Cliff,Harvey和Husbands以及南加州大学的三分之一的M. Anthony Lewis和M. Andrew H Fagg报告了自主机器人人工进化实验的有希望的结果。这项早期研究的成功引发了全球实验室的一波活动,试图利用该方法的潜力。
最近,“扩大”机器人任务的复杂性的困难已经将注意力转移到了领域的理论末端而不是工程端。
目标
进化机器人通常在同一时间完成许多不同的目标。这些包括为现实世界的机器人任务创建有用的控制器,探索进化理论的复杂性(如鲍德温效应),再现心理现象,以及通过研究人工神经网络来发现生物神经网络。通过人工进化创建控制器需要对大量人口进行大量评估。这非常耗时,这是控制器演变通常在软件中完成的原因之一。而且,初始随机控制器可能表现出潜在的有害行为,例如反复撞击到墙壁中,这可能会损坏机器人。将模拟中演变的控制器转移到物理机器人是非常困难的,并且是使用ER方法的主要挑战。原因在于,进化可以自由探索获得高适应性的所有可能性,包括模拟的任何不准确性。这种需要进行大量评估,需要快速而准确的计算机模拟,是ER方法的限制因素之一。
在极少数情况下,除了控制器之外,可以使用进化计算来设计机器人的物理结构。其中一个最着名的例子是Karl Sims的Thinking Machines Corporation演示。
动机
许多常用的机器学习算法需要一组训练示例,包括假设输入和期望答案。在许多机器人学习应用中,期望的答案是机器人采取的动作。这些动作通常不是先验明确地知道,而是机器人最多可以接收指示所采取的给定动作的成功或失败的值。进化算法是这种问题框架的自然解决方案,因为适应度函数只需要编码给定控制器的成功或失败,而不是控制器应该采取的精确动作。在机器人学习中使用进化计算的替代方法是使用其他形式的强化学习,例如q学习,来学习任何特定动作的适应性,
会议和研究所
主要会议
遗传和进化计算会议
IEEE进化计算大会
欧洲人工生命会议
ALIFE
学术机构和研究人员
查尔姆斯理工大学:Peter Nordin,人形机器人项目
萨塞克斯大学:Inman Harvey,Phil Husbands,Ezequiel Di Paolo
Consiglio Nazionale delle Ricerche(CNR):Stefano Nolfi
EPFL:Dario Floreano
苏黎世大学:Rolf Pfeifer
康奈尔大学:Hod Lipson
佛蒙特大学:Josh Bongard
印第安纳大学:兰德尔啤酒
北卡罗来纳州立大学机器人与智能机器中心:Eddie Grant,Andrew Nelson
伦敦大学学院:Peter J. Bentley
IDSIA机器人实验室:Juergen Schmidhuber,Juxi Leitner
美国海军研究实验室
奥斯纳布吕克大学,神经细胞学组:Frank Pasemann
由Karl Sims(GenArts)演化的虚拟生物
肯里纳尔多人造生命机器人
欧洲航天局的高级概念团队:Dario Izzo
巴斯克大学(UPV-EHU):RobóticaEvolutiva,PabloGonzález-Nalda(西班牙语)PDF(英文)
普利茅斯大学:Angelo Cangelosi,Davide Marocco,Fabio Ruini,* Martin Peniak
赫瑞瓦特大学:Patricia A. Vargas
皮埃尔和玛丽居里大学,ISIR:Stephane Doncieux,Jean-Baptiste Mouret
巴黎南部大学和INRIA,IAO / TAO:Nicolas Bredeche
RIKEN脑科学研究所
卡尔斯鲁厄理工学院,应用信息学和形式描述方法研究所:Lukas Koenig