Fermer

28/03/2024

Noeuds démêlants – Blog des méthodes


Je m’appelle Willem Bonnaffé, chercheur postdoctoral à l’Université d’Oxford. Dans mes recherches, j’intègre des données biologiques, de la modélisation mathématique et de l’apprentissage automatique. Je passe la plupart de mon temps à modéliser des systèmes naturels avec des équations différentielles neuronales ordinaires – NODE ou Neural ODE en abrégé. Dans cet article de blog, j’espère faire la lumière sur ce que sont ces modèles et comment j’en suis venu à les utiliser.

Par une chaude nuit d’été dans le sud de la France, j’observais des papillons de nuit voler autour d’un réverbère et j’ai repéré un frelon courant après son prochain repas. J’ai capturé la scène avec mon appareil photo et j’ai été frappé par l’enchevêtrement complexe de fils lumineux immaculés traçant les trajectoires de vol des papillons et des frelons. Comment les papillons ont-ils pu éviter d’entrer en collision les uns avec les autres tout en évitant le frelon ? Leurs schémas de vol étaient-ils aléatoires ou suivaient-ils un ensemble de règles simples ?

La modélisation mathématique est un outil puissant pour étudier la dynamique. Cela nous permet de traduire nos hypothèses en équations différentielles (ordinaires) (ODE), des équations qui décrivent le changement. Cependant, contrairement aux systèmes simples en physique, les équations appropriées sont souvent insaisissables en biologie. Lors de l’application de la modélisation mathématique aux systèmes naturels, le principal défi consiste à trouver l’équation la plus appropriée par essais et erreurs.

Dans le cas des papillons de nuit, au lieu d’essayer de proposer des équations qui capturent la complexité de leurs mouvements, j’ai adopté une approche différente.

C’est là qu’intervient la partie neuronale des NODE. Les réseaux de neurones sont des fonctions qui peuvent être considérées comme des pièces de puzzle pouvant s’adapter n’importe où. Ils peuvent être formés pour produire n’importe quelle forme. Le terme réseaux de neurones vient à l’origine de leur similitude avec le fonctionnement de base des neurones, qui intègrent des signaux provenant de différentes sources et ne se déclenchent que s’ils atteignent un seuil donné.

J’ai décidé de connecter des réseaux de neurones à des équations différentielles afin de donner à mes insectes numériques de minuscules cerveaux et de les entraîner à voler de manière naturelle. Le réseau neuronal de chaque individu focal prend la position des autres papillons nocturnes, du frelon et du lampadaire et fournit une direction et une vitesse en réponse.

Bien que la dynamique soit représentée ici en temps discret (∆t), les NODE simulent la dynamique en temps continu. Après avoir entraîné le modèle et quelques vols ratés, je suis arrivé à des modèles de vol qui imitent ceux qui se produisent naturellement autour des lampadaires.

En regardant ce que la partie neuronale des NODE avait appris, j’étais alors en mesure de découvrir les « règles » du vol des papillons. J’ai vite compris que si ces modèles NODE peuvent gérer quelques papillons de nuit, pourquoi pas un écosystème entier ? Cela m’a ouvert les yeux sur les innombrables façons dont ce cadre pourrait être utilisé pour découvrir les moteurs de la dynamique des systèmes naturels. C’est ainsi que j’ai attrapé le virus neuronal qui est finalement devenu ma thèse de doctorat.

Une application particulièrement utile de l’approche NODE consiste à étudier interactions entre espèces dans un écosystème. Nous enregistrons souvent des séries chronologiques de la taille des populations de différentes espèces qui fluctuent en fonction des conditions abiotiques et des facteurs biotiques, des rencontres entre individus, proies et prédateurs, ou des concurrents. Ces rencontres dépendent de la manière dont les individus évoluent dans un environnement dynamique. Il est pratiquement impossible pour les humains de conceptualiser fidèlement cette complexité, mais pas pour les ordinateurs.

Les réseaux de neurones peuvent apprendre à partir des données collectées sur le terrain comment l’état actuel d’un écosystème, par exemple le nombre de lièvres et de lynx et les conditions météorologiques, influence la croissance des deux populations.

Le réseau neuronal capte essentiellement le réseau complexe d’interactions entre ces variables, que nous pouvons ensuite interroger. Par exemple, nous pouvons augmenter artificiellement le nombre de prédateurs perçus par le réseau et voir dans quelle mesure il ajustera ses prévisions en fonction de la croissance de la population de proies.

Cela a un coût. L’exécution de ces modèles nécessite des simulations informatiques coûteuses. Cela est dû au fait que nous devons évaluer à plusieurs reprises les réseaux de neurones pour calculer l’état suivant jusqu’à ce que nous ayons prédit l’intégralité de la série temporelle.

Dans nos travaux les plus récents, nous avons produit une méthode qui réduit le temps moyen de formation de ces modèles de 15 minutes à 5 secondes. Cela utilise un réseau neuronal « observateur » et « processus » travaillant en tandem. Le réseau « d’observateurs » est formé pour reproduire l’ensemble des séries chronologiques de tailles de population et les changements par unité de temps. Le réseau de « processus » apprend à prendre l’état actuel de l’écosystème et à prédire l’état suivant simultanément à tous les instants. Le gain de vitesse est obtenu en partie parce que les réseaux « observateurs » et « processus » peuvent traiter l’intégralité de la série temporelle en même temps, plutôt que séquentiellement.

Notre nouvelle méthode appelée Correspondance du gradient neuronal bayésien (BNGM) débloque des calculs rapides pour les NODE. Cela nous met en mesure d’appliquer ces modèles puissants à de grands écosystèmes, où toute tentative de formuler manuellement des mécanismes appropriés finirait par échouer.

Même si nous sommes nous-mêmes limités par notre compréhension et nos données, ces modèles ne sont limités que par les données. J’espère que nous serons en mesure d’utiliser le trésor croissant de données chronologiques pour prévoir avec précision les pêcheries, la propagation des espèces envahissantes, les ravageurs et les épidémies. De grands progrès sont actuellement réalisés avec cette méthodologie en physique, en neurosciences et en IA, mais en écologie (et notamment en écologie des papillons de nuit), le plus gros du travail reste à faire !

Vous pouvez lire l’article complet ici





Source link