Un package R pour mesurer la stabilité écologique – Methods Blog

Message fourni par Ludmilla Figueiredo
La nature est très dynamique : les forêts se transforment au fil des saisons et repoussent après un incendie, les invasions d’insectes surviennent avec peu ou pas d’avertissement, et des animaux comme la tortue géante de Fernandina et le poisson tacheté de léopard reviennent d’entre les morts des décennies après une apparente extinction. Certains de ces changements font partie du comportement naturel de ces systèmes, mais d’autres sont une réponse à des perturbations. À l’Anthropocène, lorsque les écosystèmes sont soumis à diverses menaces telles que la pollution, des pluies catastrophiques et des températures extrêmes, il est particulièrement important de comprendre comment le monde naturel y réagit. Qu’est-ce qui rend un écosystème robuste au changement ? Est-ce le nombre d’espèces ? Est-ce le lien entre eux ?
Les écologistes en discutent depuis de nombreuses décennies, ce qui a conduit à diverses définitions de ce qu’est même la stabilité écologique. De nature très théorique, ce débat a conduit à l’émergence de 163 définitions de 70 concepts de stabilité dans la littérature écologique (Grimm & Wissel 1997). Viktoriia Radchuk se demandait si nous avions besoin de plusieurs propriétés de stabilité ou si nous pouvions nous contenter de mesurer l’une d’elles (par exemple, Radchuk et al., 2019). Qu’est-ce qui pousse certains chercheurs à utiliser certaines métriques plutôt que d’autres ? Comment, après des décennies de recherche en écologie de la stabilité, pouvons-nous avancer et commencer à dégager des modèles généraux ? En 2019, elle a dirigé la campagne visant à ce que les propriétés les plus couramment utilisées soient disponibles dans une seule boîte à outils. Ayant moi-même été attiré par l’attrait de prédire les réponses des écosystèmes aux perturbations depuis mon baccalauréat (ce qui m’a amené à étudier la modélisation écologique et les dettes d’extinction tout au long de ma maîtrise et de mon doctorat), j’étais très enthousiaste à l’idée de me joindre à nous. Je suis arrivé pour diriger la rédaction et le codage, et nous avons été rejoints par notre équipe de co-auteurs, comprenant divers experts en dynamique écologique, en mathématiques et en codage. À partir de cet effort, nous avons développé estar, un package pour mesurer la STAbilité écologique dans R. Un fait amusant sur le nom : même si CRAN ne permet pas au titre officiel du package d’indiquer « dans R », cette description m’a permis d’introduire un nom portugais brésilien pour le package : « estar » peut être traduit par « être dans un lieu ou un état », ce que je trouve plutôt approprié pour l’étude de la stabilité.
Étudier la stabilité est difficile…
Nous avons décidé de créer un package qui consolide les différentes manières dont la stabilité a été mesurée dans la littérature. De plus, nous voulions permettre aux chercheurs d’analyser la stabilité à l’aide des données qu’ils collectent à partir de systèmes du monde réel.
Cette tâche pose deux défis majeurs. Le premier est la quantité de données requises pour des évaluations fiables de la stabilité. Les longues séries chronologiques sont rares, nous nous attendons donc à ce que ce soit un problème auquel la plupart des utilisateurs de nos packages devront faire face. Imaginez que vous vouliez mesurer si et comment une population de chouettes se rétablit après un incendie de forêt massif. Pour caractériser correctement la population, il faudrait mesurer fréquemment la taille de la population avant et après l’incendie, afin d’identifier la dynamique de référence « habituelle » de la population et les cycles potentiels (c’est-à-dire si la population augmente et diminue naturellement au fil du temps). Il est toutefois rare que des populations ou des communautés soient suivies sur de longues périodes. Bien que les efforts de science citoyenne et les études de surveillance à long terme augmentent la disponibilité des données, le plus souvent, les données sont disponibles à de courts intervalles et/ou collectées à des fréquences incohérentes, en particulier pour les périodes précédant les perturbations. Cela pourrait signifier que l’état de référence du système n’est pas capturé de manière robuste et, par exemple, que les cycles de population de nos chouettes ne sont pas identifiés. Notre approche de ce problème consistait à donner à l’utilisateur beaucoup de contrôle pour déterminer ce qui constitue une référence pour son système d’étude. Dans le cas de nos chouettes, la référence (ou ligne de base, comme nous l’appelons dans l’article) pourrait être la taille de la population observée avant l’incendie, une autre population dans une condition similaire ou une valeur connue dans la littérature. Plus il y a de données disponibles pour éclairer ces valeurs, mieux c’est. Cependant, en l’absence de données fiables, les utilisateurs peuvent toujours explorer des scénarios et même rechercher quel type de données est critique pour chaque métrique.
Le deuxième défi consistait à rendre les mesures théoriques dérivées de modèles mathématiques utilisables par les chercheurs empiriques. Ces mesures nécessitent des données sur les forces d’interaction entre espèces, qui sont difficiles à mesurer. La force d’une interaction est l’effet de la taille de la population d’une espèce sur le taux de croissance d’une autre. Par exemple, dans une forêt, il s’agirait de savoir dans quelle mesure les hiboux affectent les populations de leurs proies et vice versa. Pour le développement de l’estar, nous pourrions heureusement nous appuyer sur le package MARSS pour estimer la force d’interaction à partir de données de séries chronologiques sur l’abondance des espèces en interaction, via des modèles « Espace d’états autorégressifs multivariés ». Nous espérons que l’intégration de ces deux étapes (estimation de la matrice d’interaction et calcul de la métrique de stabilité) dans un seul package facilitera l’étude de la stabilité d’une manière jusqu’à présent rarement explorée dans les études de terrain axées sur la stabilité des communautés.

Mais écrire un package R est tellement amusant
Un troisième défi personnel pour moi était le processus d’écriture. Depuis le début de ce projet, j’ai quitté la vie postdoctorale et j’ai déménagé à Leipzig, en Allemagne, où je travaille désormais en tant que conservateur de données et de codes pour le Centre allemand de recherche intégrative sur la biodiversité (iDiv). La nouveauté de la ville, du travail et des nouveaux collègues ont eu des conséquences néfastes, retardant le processus d’écriture. Heureusement, cependant, le processus bien structuré établi pour l’écriture d’un package R a rendu beaucoup plus amusant et plus facile d’y revenir. L’écosystème de développement R est très favorable, dans le sens où, lorsque vous écrivez le code du package en suivant le workflow de développement conçu par Hadley Wickham et Jennifer Bryan (https://r-pkgs.org/), des noms d’arguments incohérents, des tests ayant échoué et, plus important encore, de la documentation manquante vous sont régulièrement rappelés. Par conséquent, même si les parties les plus mathématiques étaient assez difficiles, me contraindre à expliquer une fonction à la fois m’a donné des étapes solides pour un programme d’écriture basé sur Pomodoro : après avoir documenté ou révisé une fonction, je pouvais me reposer. D’après le flux dans lequel je me suis engagé lors de la rédaction de la documentation, il a été plus facile de passer à la présentation et à la discussion plus larges requises pour l’article.
Une autre partie étonnamment amusante du développement d’un package R a été la conception du célèbre autocollant hexagonal. Bien que cela ne soit pas obligatoire, je ne manquerais pas l’occasion de laisser libre cours à mon côté créatif et de résumer les fonctionnalités du package dans une seule image emblématique. Nous avions des versions dans lesquelles nous jouions avec l’écriture de « e-star » pour évoquer les célèbres études de Robert Paine sur les cascades trophiques impliquant le Pisastre étoile de mer. En fin de compte, cependant, mes capacités de conception très limitées m’ont amené à choisir un hexagone, certes, d’apparence plus conservatrice, mais qui traduit notre espoir pour ce projet : qu’une variété de dynamiques de systèmes puissent être prises en compte et étudiées avec estar.
Lire l’article complet ici.
Références
Grimm, V. et Wissel, C. (1997). Babel, ou les discussions sur la stabilité écologique : un inventaire et une analyse de la terminologie et un guide pour éviter toute confusion. Œcologie, 109(3), 323-334. https://doi.org/10.1007/s004420050090
Radchuk, V., Laender, FD, Cabral, JS, Boulangeat, I., Crawford, M., Bohn, F., Raedt, JD, Scherer, C., Svenning, J.-C., Thonicke, K., Schurr, FM, Grimm, V. et Kramer-Schadt, S. (2019). La dimensionnalité de la stabilité dépend du type de perturbation. Lettres d’écologie, 22(4), 674-684. https://doi.org/10.1111/ele.13226
