Fermer

23/02/2026

Rendre la modélisation DI avancée accessible. – Blog des méthodes


Message fourni par Laura Byrne.

Je suis chercheur à l’University College Cork, en Irlande, et je travaille avec des modèles statistiques à utiliser avec des données sur la biodiversité. Mes recherches sont motivées par mes intérêts pour la durabilité, la facilitation des écosystèmes naturels ainsi que l’urbanisation nécessaire, la modélisation statistique et le codage. Vous pouvez en savoir plus sur notre travail sur les modèles Diversité-Interactions (y compris des introductions vidéo, des didacticiels de mathématiques et de codage, ainsi qu’une archive d’articles pertinents) sur notre site Web. site web.

Les modèles diversité-interactions vous conviennent-ils ?

Les modèles Diversity-Interactions (DI), bien qu’ils semblent complexes au premier abord, ne sont en réalité que vos modèles de régression habituels. Ce qui les rend spéciaux est leur hypothèse selon laquelle la principale raison derrière les changements dans les fonctions des écosystèmes (et donc les principaux effets dans un modèle de régression) sont des changements dans les proportions des espèces présentes, plutôt que simplement le nombre d’espèces (richesse) ou tout autre indice unique, par exemple l’uniformité. Comme la somme de ces effets sera égale à un (proportions), aucune constante n’est estimée pour le modèle et une modification d’un effet entraînera toujours une modification d’au moins un autre effet. Cela nous permet de comprendre comment chaque espèce contribue de manière unique à l’écosystème et si cette contribution est affectée par la présence d’autres espèces via des interactions. Ces interactions peuvent prendre de nombreuses formes et la comparaison de ces différentes structures d’interaction constitue souvent l’essentiel des analyses utilisant des modèles DI. Ces modèles peuvent être utilisés à condition de disposer d’un ensemble de données contenant des informations sur la couverture d’une unité d’étude, par exemple les proportions d’espèces dans une parcelle d’un champ, et d’au moins un enregistrement d’une réponse pour chaque unité, par exemple la biomasse végétale. Ces modèles ont été conçus pour être utilisés avec des espèces végétales mais n’ont techniquement aucune restriction dans leur utilisation, par exemple, plutôt que uniquement les espèces végétales dans un champ, nous pouvons inclure le pourcentage de couverture du sol nu en tant qu’« espèce » dans le modèle ! Des informations supplémentaires, comme le type de sol, peuvent également être facilement incluses en tant qu’effets principaux supplémentaires ou être utilisées dans des interactions.

Une représentation visuelle de la façon dont un modèle DI utilise l’estimation de l’effet principal pour chaque espèce pour prédire comment cette espèce agira dans les peuplements en monoculture et en mélange, en mettant à l’échelle cet effet en fonction de la proportion de l’espèce dans l’écosystème. Les cases noires représentent les effets d’interaction nets estimés entre les espèces présentes. Source : DImodels.com.

Où ce voyage a commencé : le package DImodels R

Auparavant, notre groupe de recherche a développé et publié le package DImodels R (disponible ici sur CRAN), dont l’article d’accompagnement a été publié dans Méthodes en écologie et évolution en 2023. Ce package a rendu incroyablement facile l’adaptation d’une gamme de modèles DI à réponse unique (univariés) à des ensembles de données, y compris des fichiers d’aide complets et des vignettes pour rendre la méthodologie aussi accessible que possible, en particulier aux non-statisticiens ! L’adoption rapide du package par les écologistes intéressés par l’utilisation des techniques de modélisation DI a solidifié notre décision de nous efforcer de créer des outils pour cette méthodologie.

Modèles DI à mesures multivariées et répétées

Bien que les modèles DI univariés puissent recueillir de nombreuses informations sur les événements au sein d’un écosystème, ils ne représentent qu’un seul instantané dans le temps pour une seule mesure du fonctionnement de l’écosystème. C’est pourquoi des modèles DI à mesures multivariées et répétées ont été développés, ainsi qu’un assortiment d’autres modèles avancés destinés à capturer les complexités de la relation entre la biodiversité et la fonction de l’écosystème (BEF). De nombreuses études BEF différentes se déroulent sur de longues périodes et incluent l’enregistrement de nombreuses réponses différentes des fonctions de l’écosystème, prêtes à être utilisées avec ces modèles DI qui peuvent prendre en compte les corrélations entre les lectures de la même unité. Cependant, des données et des modèles plus complexes nécessitent une expérience supplémentaire en matière de codage et des connaissances sur la manière d’interpréter les modèles.

Une photo montrant l’auteur de ce blog (Laura Byrne, statisticienne)
tenter de contribuer à la collecte de données sur les prairies.

J’ai appris de mon court séjour au Réserve scientifique de l’écosystème de Cedar Creek avec l’Université du Minnesota et au département de biologie de l’Université du Dakota du Nord, combien de sang, de sueur et de larmes peuvent entrer dans la collecte des données que je trouve sur mon bureau dans un fichier Excel soigné. Après tout le travail nécessaire à la collecte de ces données, pourquoi devrait-il être si difficile de les utiliser dans une analyse ? Ces expériences, ainsi que celles de mes collègues, nous ont poussés à nous concentrer sur le côté convivial de la conception d’outils lors du développement du package DImodelsMulti R.

Développement et décisions

Étant donné que le format du package DImodels R a été bien accueilli et pour éviter toute confusion lors de l’échange entre les packages, DImodelsMulti a été conçu pour suivre un flux de travail très similaire, avec des noms de paramètres correspondants dans les principales fonctions d’ajustement (DI() et DImulti()). Il a également été assuré que les modèles adaptés à l’un ou l’autre package pouvaient être utilisés avec le DImodèlesVis package pour produire des visualisations faciles à interpréter. Les deux packages sont remplis de fichiers d’aide, de vignettes et, pour DImodelsMulti, d’une application R Shiny pour rendre l’apprentissage de l’utilisation de ces outils aussi simple que 1, 2, 3.

Un organigramme montrant comment les packages DImodels et DImodelsMulti R sont destinés à être utilisés.

Au cours du développement, la question de savoir dans quelle mesure nous facilitons l’exécution de la fonction appropriée est restée avec nous tout au long du processus : lorsque nous rencontrons un problème, (a) faisons-nous une hypothèse sur ce que l’utilisateur avait l’intention de faire, résolvons-nous le problème, imprimons-nous un message à l’utilisateur indiquant le problème et comment nous l’avons résolu, ou (b) arrêtons-nous l’exécution du code et affichons-nous un message d’erreur à l’utilisateur, détaillant comment il peut procéder pour résoudre le problème ? Notre équipe comptait des personnes aux deux extrémités de ce spectre, sachant que des messages d’erreur constants pour chaque petit problème peuvent être gênants lors de l’utilisation d’une fonction, mais aussi que le risque qu’un modèle inexact soit généré et interprété, manquant le message d’avertissement imprimé, était un résultat inquiétant. Nous avons finalement opté pour un mélange entre (a) et (b), selon la nature du problème. Pour des problèmes relativement simples, de faible conséquence si notre hypothèse de résolution du problème n’était pas exacte, nous avons choisi de donner la priorité à la transmission d’un résultat de modèle à l’utilisateur, tandis que pour des problèmes plus flagrants, nous avons décidé qu’il serait préférable de laisser l’utilisateur résoudre le problème (à l’aide de messages d’erreur clairs !).

Enveloppez-le

Nous espérons que cet outil, son prédécesseur et tout ajout futur à la famille de packages DImodels R vous permettront de tirer le meilleur parti de vos données en un clin d’œil ! Peut-être même inciter d’autres développeurs à suivre dans cette quête visant à combler le fossé entre statisticiens et écologistes. Bonne analyse.

Lire l’article complet ici.

Article édité par Standiwe Nomthandazo Kanyile.





Source link