Fermer

21/03/2024

comment cet article est né – Blog des méthodes


Message fourni par Alison Binley

En tant que nouvel étudiant à la maîtrise à l’Université Carleton, j’étais ravi d’apprendre les tenants et les aboutissants de l’utilisation des données scientifiques communautaires (également connues sous le nom de science citoyenne, recherche participative et données provenant de sources participatives) pour mener des recherches sur la conservation. Je travaillais sur l’estimation des tendances démographiques en utilisant eBird, une plateforme scientifique communautaire populaire et opportuniste qui collecte des données sur les oiseaux, et fasciné par les possibilités d’avoir une ressource aussi immense à ma disposition. Cependant, à ma grande surprise, alors que j’assistais à ma première conférence d’ornithologie, j’ai découvert que presque personne n’utilisait ces données dans ses recherches. De plus, j’ai été interrogé de manière assez rigoureuse sur la question de savoir si mes données étaient « dignes de confiance » et si elles avaient leur place aux côtés d’ensembles de données professionnelles collectées de manière plus conventionnelle.

Au fil des années, je continuerais d’entendre des variations sur ce thème. Que se passe-t-il si quelqu’un soumet quelque chose qui ne va pas ? Que se passe-t-il si deux individus ou plus signalent le même oiseau ? Allez-vous alors compter deux fois cet oiseau ? En quoi ces données sont-elles utiles s’il n’existe pas de protocole d’enquête ? Étonnamment, moi-même et d’autres personnes travaillant avec des ensembles de données scientifiques communautaires avions déjà examiné ces problèmes et développé des stratégies pour les surmonter (https://doi.org/10.1111/2041-210X.13834). De plus en plus d’efforts de recherche sont déployés pour développer des méthodes statistiques afin de mieux comprendre et travailler avec ces ensembles de données, et d’ajuster les biais associés à l’endroit où les gens préfèrent collecter les données, à la manière dont différentes personnes collectent les données et au risque de commettre des erreurs.

Crédit photo Brandon Edwards

Le Data Double Standard est né du désir non seulement de répondre à ces préoccupations, mais également de renverser le récit. Parce que ces avancées méthodologiques issues de la nécessité de donner un sens aux données scientifiques communautaires peuvent également être utilisées pour améliorer les données collectées par les experts. En fait, l’utilisation complémentaire de données provenant à la fois de sources participatives et de données collectées par des professionnels peut nous aider à dresser le tableau le plus clair de l’état de la biodiversité. Par exemple, étant donné que de nombreux programmes scientifiques communautaires permettent aux participants de collecter des données où ils le souhaitent, cela entraîne un biais spatial dans l’ensemble de données. Cependant, les données collectées par les professionnels, bien qu’elles soient généralement soumises à des protocoles de conception d’étude qui tentent d’éliminer de tels biais, ne sont pas entièrement à l’abri de ce problème (https://doi.org/10.1890/110154). Pourquoi ne pas orienter nos efforts de surveillance professionnelle pour combler les lacunes des ensembles de données issus du crowdsourcing ?

Crédit photo Brandon Edwards

Aujourd’hui, en tant que chercheur postdoctoral au Cornell Lab of Ornithology, j’utilise toujours les données eBird, ainsi que de nombreux autres ensembles de données librement disponibles, pour soutenir mes recherches. De nombreuses espèces ont cruellement besoin d’interventions de conservation, et le fait de disposer de ces données me permet de fournir des recommandations rapides qui restent fondées sur des preuves. J’utilise un cadre décisionnel structuré pour optimiser la mise en œuvre d’interventions de conservation temporaires dans des paysages dominés par l’homme, visant à maximiser les bénéfices pour la biodiversité tout en minimisant les interruptions des activités humaines telles que la production agricole. Il reste encore des défis analytiques à relever pour garantir que ces recommandations ne sont pas biaisées par des artefacts statistiques propagés à travers les données sous-jacentes. Cependant, je suis convaincu que je prends en compte toutes les lacunes potentielles de mes données, quelle que soit la manière dont elles ont été collectées.

Vous pouvez lire l’article complet ici.





Source link