Outil simple et intuitif pour la prise de décision de gestion de la population – Blog de méthodes

Post fourni par Izzy McCabe
Les prédictions des populations d’insectes à partir de modèles de phénologie et d’échantillonnage peuvent aider les producteurs à gérer les ravageurs et les insectes bénéfiques dans leurs fermes. Les modèles de phénologie relient les unités thermiques accumulées après le développement de l’hiver et des ravageurs et éclairent ainsi le calendrier des actions de contrôle, tandis que l’échantillonnage repose sur la collecte régulière des données sur place (quotidien, hebdomadaire, etc.) pour mesurer les densités de population de ravageurs et estimer les dommages potentiels. Un inconvénient de ces méthodes est que la phénologie et l’échantillonnage sont souvent considérés comme indépendamment, et les producteurs doivent compter sur leur intuition et leur expérience pour relier les points. Une façon de résoudre ce problème est d’établir un nombre maximal de ravageurs individuels capturés lors de l’échantillonnage pour chaque valeur d’accumulation de chaleur au fil du temps, sur la base d’un modèle de phénologie et d’un seuil économique. Cependant, les données recueillies par les producteurs proviennent d’un nombre variable d’unités d’échantillonnage, et les dénombrements sont difficiles à comparer avec un seuil dynamique. Un défi consiste donc à trouver une procédure statistique qui permet aux producteurs de voir la probabilité de dépasser leur densité de ravageurs maximale tolérable de leurs données d’échantillonnage le plus tôt possible. Cela a commencé une ramification de nos travaux, qui a abouti à la publication de «test séquentiel des hypothèses complémentaires sur la densité de la population» dans MEE sur notre nouvelle méthode statistique, le test séquentiel des probabilités postérieures bayésiennes ou le STBP.

Les données pour l’échantillonnage des ravageurs se présentent régulièrement par lots, donc plutôt que des outils traditionnels de test d’hypothèse qui considèrent tous les échantillons en même temps, nous avons recherché la littérature pour une analyse séquentielle, qui met à jour de manière itérative les prédictions à mesure que de nouvelles données arrivent. Les méthodes existantes, cependant, avaient des limites. La procédure d’analyse des données séquentielles la plus populaire est le test de rapport de probabilité séquentiel (SPRT), introduit en 1945 par Abraham Wald, mais il nécessite des tailles d’échantillon fixe et ne teste que des hypothèses non complémentaires. Par exemple, un SPRT typique peut comparer si les ravageurs moyens par échantillon sont plus susceptibles d’être de 8 vs 10. Au lieu de cela, ce dont nous avons besoin est une méthode pour tester des hypothèses complémentaires, par exemple si les ravageurs moyens par échantillon sont plus susceptibles d’être plus ou inférieurs à 9. En outre, la méthodologie d’origine unique Taille d’échantillon fixe et prédéterminé pour chaque lot. Nous pensions que le problème de la mise à jour de manière itérative de nos connaissances et de nos prédictions basés sur de nouvelles données s’aligne sur les statistiques bayésiennes, et nous avons trouvé des méthodes utilisant la règle de Bayes au domaine des tests d’hypothèse séquentiels dans le test de rapport de probabilité variable de Morgan & Cressie (VPRT). Leur méthode, tout en offrant des propriétés convaincantes, nécessite toujours des ratios d’hypothèse non complémentaires et est livrée avec les complexités de calcul typiques des méthodes bayésiennes. Le STBP peut être considéré comme se construisant sur le VPRT et vise à fournir une procédure intuitive qui prend explicitement les tailles d’échantillon variables au fil du temps, les hypothèses de style seuil explicites et même les trajectoires dynamiques comme hypothèses. Le STBP fonctionne en effectuant une simplification cruciale des méthodes bayésiennes typiques: au lieu de la spécification des distributions de probabilité antérieures appropriées, il attribue une seule probabilité au paramètre d’inférence étant plus (ou moins) qu’un seuil et la probabilité complémentaire pour qu’elle soit moins (ou plus grande) que ce seuil. Ceci est en comparaison avec la procédure typique de donner chaque valeur possible du paramètre sa propre densité de probabilité. Cela réduit la probabilité postérieure résultante d’une distribution entière à un seul nombre, que nous pouvons ensuite brancher l’équation comme probabilité antérieure pour la prochaine itération. Il élimine également l’exercice de calcul de l’intégration à des fonctions de densité de probabilité conjointe en constante évolution qui constituent la principale limitation des méthodes bayésiennes typiques. Les intégrales ne doivent être calculées que sur la fonction de vraisemblance souhaitée, pour laquelle toutes les distributions couramment utilisées ont déjà des solutions de forme fermée sous la forme de leurs fonctions de densité cumulative. Bien que notre méthode ait un taux plus élevé de faux positifs par rapport au SPRT dans des conceptions séquentielles à une seule fois, il l’a surperformée lorsque des épisodes d’échantillonnage séquentiels sont faits de plusieurs échantillons. En général, le STBP nécessite moins d’échantillonnage et d’erreurs à l’échelle plus favorablement avec l’augmentation des tailles d’échantillon à chaque temps d’échantillonnage que le SPRT. Nous avons également testé notre méthode comme procédure de surveillance des espèces envahissantes, où elle a démontré une puissance plus élevée pour des tailles d’échantillon égales que les approches conventionnelles, avec de nouvelles réductions de l’échantillonnage requis lorsque la croyance préalable en l’absence des espèces envahissantes est déjà élevée. Nous avons également constaté que notre modèle simplifié converge rapidement les résultats produits par des techniques bayésiennes plus complexes nécessitant des priors conjugués appropriés simplement en augmentant la taille de l’échantillon.



Étant donné que notre méthode permet à la fois des tailles d’échantillon variables et des comparaisons séquentielles pour les hypothèses changeantes mais liées, il a des applications potentielles dans la surveillance continue du traitement du signal, de la détection de fraude, de la criminalistique et des tests cliniques (comme celui des changements dans les niveaux de glucose, la fréquence cardiaque ou la mortalité). Par exemple, si les taux de mortalité des patients attendus pour certaines procédures cliniques étaient continuellement comparés à ceux des praticiens individuels via STBP, nous avons constaté que Les assassins en série de Harold Shipman aurait pu être détecté avec une grande confiance au début des années 80 pour les femmes victimes et au début des années 90 pour les victimes masculines. Malheureusement, le tristement célèbre «Dr. Death» a été condamné en janvier 2000 alors qu’il avait tué près de 300 personnes.

Notre méthode représente l’innovation dans une section de la littérature écologique et agricole qui est restée largement stagnée pendant des décennies. Le SPRT, introduit en 1945, est toujours la méthode la plus utilisée pour l’analyse séquentielle, et la méthode de taille d’échantillon fixe utilisée dans la surveillance des espèces envahissantes a été utilisée inchangée depuis son introduction en 1993. Nous prévoyons de travailler pour intégrer le STBP dans les stratégies de gestion des ravageurs intégrées dans le Nord-Ouest du Pacifique, et espérons voir d’autres personnes dans leurs coins scientifiques et industrielles où il peut améliorer leurs processus et leurs recherches. Pour faciliter cela, nous travaillons sur un package R qui sera facile à utiliser, extensible et disponible dans le référentiel CRAN dans les prochaines semaines. Le code source peut être trouvé dans ce Référentiel GitHub.
Lire l’article complet ici.
Merci à Emily Rampone pour sa précieuse révision à ce post!