leçons tirées du développement d’un package pour estimer le flux de carbone du sol sur les sites de l’Observatoire national écologique à travers les États-Unis – Methods Blog

Par Naupaka Zimmerman et John Zobitz
Nous (Naupaka et John) sommes professeurs dans des établissements principalement de premier cycle (PUI) où nos vies sont un mélange d’enseignement et d’érudition. Nous sommes toujours à la recherche de projets qui ont un impact simultané sur nos tâches d’enseignement, de mentorat et de bourses d’études, ces points idéaux où un seul effort fait avancer plusieurs objectifs. En raison de charges d’enseignement plus élevées et de missions institutionnelles axées sur la recherche de premier cycle, il peut être difficile pour les professeurs du PUI de collecter des ensembles de données complets pour répondre par eux-mêmes à des questions à grande échelle en écologie et en sciences de l’environnement. C’est là que des ressources telles que Réseau National d’Observatoires Écologiques (NEON) Les ensembles de données de NEON permettent aux professeurs de tous types d’établissements de s’attaquer à des questions écologiques à grande échelle et représentent des produits de données empiriques prêts à l’emploi qui fonctionnent également très bien pour une utilisation en classe. Depuis 2014, les scientifiques et techniciens de NEON ont travaillé dur pour collecter, vérifier la qualité et mettre à disposition de riches ensembles de données écologiques provenant de tout le pays, nous offrant ainsi, en tant que chercheurs, un catalogue massif de données environnementales librement disponibles avec lesquelles travailler (et jouer !).
Ce type de données constitue la rampe de lancement idéale pour aborder de grands sujets, comme l’examen des changements dans sol carbone à travers divers écosystèmes dans le contexte d’un environnement en évolution. Les sols tiennent environ moitié de tout le carbone terrestre. Mesurer la quantité de carbone du sol qui quitte ensuite le sol pour entrer dans l’atmosphère (le « flux » de CO gazeux2) est délicat. Historiquement, les chercheurs se sont généralement appuyés sur des chambres automatisées ou sur un échantillonnage périodique manuel des flux à l’aide de colliers de sol (des sections de tuyaux en PVC coupés enfoncées dans le sol pour permettre l’échantillonnage du flux de gaz sur une surface définie du sol). L’utilisation de chambres ou de colliers sur des dizaines ou des centaines de sites tout au long de l’année serait d’un coût prohibitif et nécessiterait un travail intensif sur le terrain, ce qui rendrait cette approche hors du domaine des possibilités pour de nombreuses équipes de chercheurs. Une autre approche qui a été utilisée pour caractériser le CO du sol2 flux l’estime à partir d’une suite de capteurs environnementaux effectuant des mesures continues à différentes profondeurs du sol. Cette approche non interventionniste permet des estimations continues (au lieu de points dans le temps) des taux de flux, mais il peut être un peu délicat de paramétrer correctement les équations d’estimation.
Nous avons donc décidé d’utiliser l’une de ces approches pour aborder l’autre. Plus précisément, notre étude récemment publiée dans MEE, neonSoilFlux : un package R pour l’estimation continue du CO dans le sol basée sur des capteurs2 fluxa utilisé les données de flux collectées sur le terrain pour aider à paramétrer et valider un package R qui calcule des estimations de flux de carbone du sol à partir des données du capteur de sol NEON. Le progiciel produit une estimation du flux du sol en combinant les flux de données existants collectés par NEON sur tous ses sites terrestres : CO du sol2 concentrations, température du sol, humidité du sol et autres mesures. Ce projet, financé par la National Science Foundation (NSF awards 2017829 et 2017860), axé sur la construction d’un produit de flux de sol de référence défendable pour les sites NEON. Nous espérons qu’un tel produit s’avérera utile dans la communauté en tant que ressource supplémentaire aux côtés des bases de données existantes sur les mesures des flux de carbone dans le sol, telles que la base de données sur la respiration du sol (SRDB) et la base de données sur la respiration continue du sol (COSORÉ).
Cet effort comportait deux fronts interconnectés. Le premier impliquait beaucoup de codage et le second impliquait beaucoup de travail sur le terrain. Notre co-auteur, Ed Ayres, avait esquissé un code fondamental en R qui s’appliquait La loi de Fick pour calculer les flux du sol à partir des données des capteurs NEON. Notre tâche initiale consistait à prendre ce code et à le transformer en un Forfait R. Il s’agissait moins d’écrire du nouveau code que de structure. Nous avons divisé l’ensemble du processus en trois modules principaux : premièrement, l’acquisition des données brutes de l’API NEON ; deuxièmement, harmoniser les différents formats de données ; et troisièmement, calculer les flux estimés. Au sein de ces modules, nous avons ensuite créé de petites fonctions à usage unique : dont une pour les conversions d’unités, une pour le calcul de la diffusivité, ainsi que bien d’autres selon les besoins. La modularisation du code nous permet de fournir des mises à jour faciles du package. John a dirigé cet effort de développement et de test du code, guidant une équipe d’étudiants de premier cycle de l’Université d’Augsbourg à travers les tenants et les aboutissants du développement de logiciels scientifiques.

Le deuxième front de cet effort consistait à valider les prédictions informatiques du flux basées sur des capteurs par rapport aux mesures empiriques du flux sur site dans le monde réel. Cela a nécessité des travaux sur le terrain sur six sites NEON principaux dans l’ouest et le Midwest des États-Unis continentaux ; cet effort a duré plusieurs années et des road trips vraiment épiques. Naupaka a dirigé cet effort avec des équipes d’étudiants de premier cycle de l’Université de San Francisco. Réaliser des travaux sur le terrain, même sur un seul site, est souvent un défi, entre jongler avec le transport de l’équipement, les défis météorologiques imprévisibles, les autorisations, les essaims d’insectes piqueurs (c’est-à-dire le débogage réel) et une myriade d’autres logistiques. Mener le travail de terrain sur six sites dans six États nous a donné un sentiment encore plus fort de gratitude et d’appréciation pour ce que des organisations comme NEON fournissent gratuitement au public.

Avec les données de terrain durement acquises en main, nous nous sommes ensuite concentrés ensemble sur la comparaison des deux ensembles d’estimations de flux (basées sur des capteurs et mesurées manuellement sur le terrain) sur chaque site.. Nous avons passé de nombreux mois à déboguer, à vérifier les erreurs d’analyse et à lutter contre les indicateurs de contrôle qualité de la teneur en eau du sol. Même s’il aurait été agréable (bien que peut-être un peu suspect) d’avoir un accord parfait entre les deux approches, les enseignements écologiques les plus intéressants de ce projet proviennent des sites et des époques où les deux ensembles de données ne concordaient pas.

En approfondissant nos recherches (hah !), nous avons découvert que deux ensembles de facteurs sont très importants pour déterminer dans quelle mesure les flux modélisés correspondent à ceux mesurés sur le terrain. La première consiste à choisir les profondeurs particulières des capteurs de sol à utiliser pour estimer le flux de surface (par exemple, les trois profondeurs des capteurs de sol ou seulement les deux profondeurs inférieures, etc.). La seconde consiste à choisir la manière dont la diffusivité du sol est estimée sur chaque site. Les données de terrain nous ont montré qu’au lieu d’une approche globale, l’utilisateur aurait besoin de flexibilité. Ainsi, au lieu de simplement calculer une seule estimation de flux pour un site et une période donnés, nous avons repensé le package pour calculer une suite d’estimations de flux, permettant à l’utilisateur de sélectionner celle qui est susceptible de fonctionner le mieux pour un site donné ou de les regrouper pour fournir une estimation d’ensemble s’il préfère.

La principale leçon que nous avons tirée de ce projet ? La même chose que nous espérons que les étudiants apprendront lorsqu’ils relèveront leur propre défi scientifique pour la première fois. Que les cas où le modèle n’a pas Les données qui correspondent sont souvent celles où se cachent les connaissances scientifiques les plus intéressantes. Que le processus itératif (et oui, souvent émotionnellement difficile) consistant à tester et à affiner des hypothèses par rapport à des mesures prises dans le monde réel peut à la fois nous apprendre de nouvelles choses sur la façon dont le monde fonctionne, et aussi être intellectuellement satisfaisant d’une manière assez particulière.
Le forfait est disponible sur GitHub et sur CRANet l’article est disponible auprès de MEE avec une licence en libre accès.
