La robotique développementale (DevRob), parfois appelée robotique épigénétique, est un domaine scientifique qui vise à étudier les mécanismes de développement, les architectures et les contraintes qui permettent un apprentissage à vie et illimité de nouvelles compétences et de nouvelles connaissances dans les machines incorporées. Comme chez les enfants, l’apprentissage devrait être cumulatif et de plus en plus complexe, et résulter d’une auto-exploration du monde en combinaison avec une interaction sociale. L’approche méthodologique typique consiste à partir de théories du développement humain et animal élaborées dans des domaines tels que la psychologie du développement, les neurosciences, la biologie du développement et de l’évolution et la linguistique, puis à les formaliser et à les mettre en œuvre dans des robots, en explorant parfois des extensions ou des variantes. L’expérimentation de ces modèles dans des robots permet aux chercheurs de les confronter à la réalité. Par conséquent, la robotique du développement fournit également des informations en retour et de nouvelles hypothèses sur les théories du développement humain et animal.
La robotique développementale est liée à la robotique évolutive (ER), mais en diffère. ER utilise des populations de robots qui évoluent dans le temps, tandis que DevRob s’intéresse à la manière dont l’organisation d’un système de contrôle d’un seul robot se développe au fil de l’expérience.
DevRob est également lié au travail effectué dans les domaines de la robotique et de la vie artificielle.
Contexte
Un robot peut-il apprendre comme un enfant? Peut-il acquérir une variété de nouvelles compétences et de nouvelles connaissances non spécifiées au moment de la conception et dans un environnement partiellement inconnu et en mutation? Comment peut-il découvrir son corps et ses relations avec l’environnement physique et social? Comment ses capacités cognitives peuvent-elles se développer continuellement sans l’intervention d’un ingénieur une fois qu’il est « sorti de l’usine »? Que peut-il apprendre grâce aux interactions sociales naturelles avec les humains? Ce sont les questions au centre de la robotique développementale. Alan Turing, ainsi qu’un certain nombre d’autres pionniers de la cybernétique, avaient déjà formulé ces questions et l’approche générale en 1950, mais ce n’est qu’à partir de la fin du XXe siècle qu’ils ont commencé à faire l’objet d’une enquête systématique.
Le concept de machine intelligente adaptative étant au cœur de la robotique de développement, il est en relation avec des domaines tels que l’intelligence artificielle, l’apprentissage automatique, la robotique cognitive ou les neurosciences computationnelles. Cependant, s’il peut réutiliser certaines des techniques élaborées dans ces domaines, il en diffère sous de nombreux angles. Elle se distingue de l’intelligence artificielle classique par le fait qu’elle n’assume pas la capacité de raisonnement symbolique avancé et se concentre sur les compétences sensorimotrices et sociales incarnées et situées plutôt que sur des problèmes symboliques abstraits. Il diffère de l’apprentissage automatique traditionnel car il vise un apprentissage autodéterminé indépendant de la tâche plutôt qu’une inférence spécifique à une tâche plutôt que des «données sensorielles éditées par l’homme et générées à la cuillère» (Weng et al., 2001). Elle diffère de la robotique cognitive car elle se concentre sur les processus permettant la formation de capacités cognitives plutôt que sur ces capacités elles-mêmes. Il diffère de la neuroscience informatique car il se concentre sur la modélisation fonctionnelle d’architectures intégrées de développement et d’apprentissage. Plus généralement, la robotique de développement est caractérisée par les trois caractéristiques suivantes:
Il cible les architectures et les mécanismes d’apprentissage indépendants des tâches, c’est-à-dire que la machine / robot doit être capable d’apprendre de nouvelles tâches inconnues de l’ingénieur;
Il met l’accent sur le développement ouvert et l’apprentissage tout au long de la vie, c’est-à-dire la capacité d’un organisme à acquérir en permanence de nouvelles compétences. Cela ne doit pas être compris comme une capacité à apprendre «n’importe quoi» ou même «tout», mais simplement que l’ensemble des compétences acquises peut être étendu à l’infini au moins dans certaines directions (pas toutes);
La complexité des connaissances et des compétences acquises augmentera (et cette augmentation sera contrôlée) progressivement.
La robotique de développement a émergé au carrefour de plusieurs communautés de recherche, y compris l’intelligence artificielle incarnée, les sciences cognitives des systèmes énactifs et dynamiques, le connexionnisme. Partant de l’idée essentielle que l’apprentissage et le développement sont le résultat auto-organisé des interactions dynamiques entre les cerveaux, les corps et leur environnement physique et social, et en essayant de comprendre comment cette auto-organisation peut être exploitée pour fournir un apprentissage continu indépendant de la tâche des compétences de plus en plus complexes, la robotique du développement interagit fortement avec des domaines tels que la psychologie du développement, les neurosciences du développement et cognitives, la biologie du développement (embryologie), la biologie de l’évolution et la linguistique cognitive. Comme beaucoup des théories issues de ces sciences sont verbales et / ou descriptives, cela implique une formalisation cruciale et une activité de modélisation informatique en robotique du développement. Ces modèles informatiques ne sont alors pas seulement utilisés pour explorer les moyens de construire des machines plus polyvalentes et adaptatives, mais également pour évaluer leur cohérence et éventuellement explorer d’autres explications permettant de comprendre le développement biologique.
Directions de recherche
Domaines de compétences
En raison de l’approche générale et de la méthodologie employées, les projets de robotique de développement visent généralement à ce que les robots développent les mêmes types de compétences que les enfants en bas âge. L’acquisition de compétences sensorimotrices est une première catégorie de recherche importante. Celles-ci incluent la découverte de son propre corps, y compris sa structure et ses dynamiques telles que la coordination main-œil, la locomotion et l’interaction avec les objets, ainsi que l’utilisation d’outils, en mettant un accent particulier sur la découverte et l’apprentissage des abordations. Les compétences sociales et linguistiques constituent une deuxième catégorie de compétences ciblées par les robots de développement: l’acquisition de jeux de comportement sociaux simples tels que la prise de tour, l’interaction coordonnée, le lexique, la syntaxe et la grammaire, ainsi que l’enracinement de ces compétences linguistiques en compétences sensorimotrices comme symbole de masse). En parallèle, l’acquisition des compétences cognitives associées est à l’étude, comme l’émergence de la distinction auto / non-soi, le développement des capacités de l’attention, des systèmes de catégorisation et la représentation à un niveau supérieur de la puissance ou de la construction sociale, de l’émergence de valeurs , empathie ou théories de l’esprit.
Mécanismes et contraintes
Les espaces sensorimoteurs et sociaux dans lesquels vivent les humains et les robots sont si vastes et complexes que seule une petite partie des compétences pouvant être apprises peut réellement être explorée et apprise au cours de la vie. Ainsi, des mécanismes et des contraintes sont nécessaires pour guider les organismes de développement dans leur développement et leur maîtrise de la croissance de la complexité. Il existe plusieurs familles importantes de ces mécanismes et contraintes de guidage qui sont étudiés dans la robotique du développement, tous inspirés par le développement humain:
Les systèmes de motivation, générant des signaux de récompense internes qui stimulent l’exploration et l’apprentissage, peuvent être de deux types principaux:
des motivations extrinsèques poussent les robots / organismes à maintenir des propriétés internes spécifiques telles que le niveau de nourriture et d’eau, l’intégrité physique ou la lumière (par exemple, dans les systèmes phototropes);
des motivations intrinsèques poussent le robot à rechercher la nouveauté, le défi, la compression ou les progrès d’apprentissage en soi, générant ainsi ce que l’on appelle parfois l’apprentissage et l’exploration fondés sur la curiosité, ou encore l’apprentissage et l’exploration actifs;
Orientation sociale: dans la mesure où les humains apprennent beaucoup en interagissant avec leurs pairs, la robotique du développement étudie les mécanismes permettant aux robots de participer à des interactions sociales analogues à celles des humains. En percevant et en interprétant les signaux sociaux, cela pourrait permettre aux robots d’apprendre des êtres humains (par divers moyens, tels que l’imitation, l’émulation, l’amélioration du stimulus, la démonstration, etc.) et de déclencher une pédagogie humaine naturelle. Ainsi, l’acceptation sociale des robots de développement est également étudiée;
Biais d’inférence statistique et réutilisation cumulative de connaissances / compétences: les biais caractérisant à la fois les représentations / encodages et les mécanismes d’inférence peuvent généralement permettre une amélioration considérable de l’efficacité de l’apprentissage et sont donc étudiés. À cet égard, les mécanismes permettant de déduire de nouvelles connaissances et d’acquérir de nouvelles compétences en réutilisant des structures précédemment apprises constituent également un domaine d’étude essentiel;
Les propriétés de réalisation, notamment la géométrie, les matériaux ou les primitives / synergies motrices innées, souvent codées sous forme de systèmes dynamiques, peuvent considérablement simplifier l’acquisition de compétences sensorimotrices ou sociales, et sont parfois appelées calcul morphologique. L’interaction de ces contraintes avec d’autres contraintes constitue un axe d’investigation important;
Contraintes de maturation: chez le nourrisson, le corps et le système nerveux grandissent progressivement, au lieu d’être complets à la naissance. Cela implique par exemple que de nouveaux degrés de liberté, ainsi que des augmentations du volume et de la résolution des signaux sensorimoteurs disponibles, peuvent apparaître au fur et à mesure de l’apprentissage et du développement. Transposer ces mécanismes dans des robots de développement et comprendre comment ils peuvent gêner ou au contraire faciliter l’acquisition de compétences nouvelles et complexes est une question centrale de la robotique de développement.
Du développement bio-mimétique à l’inspiration fonctionnelle.
Alors que la plupart des projets de robotique développementale interagissent fortement avec les théories du développement humain et humain, les degrés de similitude et d’inspiration entre les mécanismes biologiques identifiés et leur contrepartie dans les robots, ainsi que les niveaux d’abstraction de la modélisation, peuvent varier considérablement. Alors que certains projets visent à modéliser avec précision la fonction et la mise en œuvre biologique (modèles neuronaux ou morphologiques), comme en neurorobotique, d’autres projets se concentrent uniquement sur la modélisation fonctionnelle des mécanismes et des contraintes décrits ci-dessus, et pourraient par exemple être réutilisés dans leurs techniques d’architectures. provenant de mathématiques appliquées ou d’ingénierie.
Questions ouvertes
La robotique de développement étant un domaine de recherche relativement nouveau et à la fois très ambitieux, de nombreux défis ouverts fondamentaux restent à résoudre.
Tout d’abord, les techniques existantes sont loin de permettre aux robots de grande dimension du monde réel d’apprendre un répertoire ouvert de compétences de plus en plus complexes sur une période de vie. Les espaces sensorimoteurs continus de grande dimension constituent un obstacle majeur à résoudre. L’apprentissage cumulatif tout au long de la vie en est un autre. En réalité, aucune expérience de plus de quelques jours n’a encore été mise en place, ce qui contraste sévèrement avec le temps nécessaire aux nourrissons pour acquérir les habiletés sensorimotrices de base tout en disposant de cerveaux et de morphologies énormément plus puissants que les mécanismes de calcul existants.
Parmi les stratégies à explorer pour progresser vers cet objectif, l’interaction entre les mécanismes et les contraintes décrites dans la section précédente doit être étudiée plus systématiquement. En effet, ils ont jusqu’à présent été principalement étudiés de manière isolée. Par exemple, l’interaction entre l’apprentissage intrinsèquement motivé et l’apprentissage guidé par la société, éventuellement limité par la maturation, est une question essentielle à étudier.
Un autre défi important consiste à permettre aux robots de percevoir, d’interpréter et de tirer parti de la diversité des signaux sociaux multimodaux fournis par des humains non ingénieurs lors d’interactions homme-robot. Jusqu’à présent, ces capacités sont pour la plupart trop limitées pour permettre un enseignement efficace général par des êtres humains.
Un problème scientifique fondamental à comprendre et à résoudre, qui s’applique également au développement humain, est la manière dont la compositionnalité, les hiérarchies fonctionnelles, les primitives et la modularité, à tous les niveaux des structures sensorimotrices et sociales, peuvent être formées et exploitées au cours du développement. Ceci est profondément lié au problème de l’émergence de symboles, parfois appelé le « problème de la mise à la terre des symboles » lorsqu’il s’agit d’acquisition de la langue. En réalité, l’existence même et la nécessité de symboles dans le cerveau sont activement remises en question, et des concepts alternatifs, permettant toujours la compositionnalité et les hiérarchies fonctionnelles, sont à l’étude.
Au cours de l’épigénèse biologique, la morphologie n’est pas fixe, mais se développe plutôt en interaction constante avec le développement des compétences sensorimotrices et sociales. Le développement de la morphologie pose des problèmes pratiques évidents avec les robots, mais il peut s’agir d’un mécanisme crucial qui devrait être approfondi, du moins en simulation, comme en robotique morphogénétique.
Un autre problème ouvert est la compréhension de la relation entre les phénomènes clés étudiés par la robotique du développement (systèmes sensorimoteurs hiérarchiques et modulaires, motivations intrinsèques / extrinsèques / sociales et apprentissage ouvert) et les mécanismes cérébraux sous-jacents.
De même, en biologie, les mécanismes de développement (opérant à l’échelle du temps ontogénétique) interagissent fortement avec les mécanismes de l’évolution (opérant à l’échelle du temps phylogénétique), comme le montre la florissante littérature scientifique « evo-devo ». Cependant, l’interaction de ces mécanismes dans des organismes artificiels, en particulier les robots de développement, est encore largement sous-estimée. L’interaction des mécanismes évolutifs, le développement des morphologies et le développement des compétences sensorimotrices et sociales constitueront donc un sujet extrêmement stimulant pour l’avenir de la robotique du développement.