Étudier la transmission sociale à l’aide de STbayes – Methods Blog

Message fourni par Michael Chimento.
Lors des études culture animaleil est important de déterminer si de nouveaux comportements ou informations se sont propagés par le biais de contacts sociaux, ou s’ils sont plutôt innovés ou découverts personnellement. Malheureusement, nous ne pouvons pas mener une enquête auprès des animaux pour leur demander comment ils ont appris quelque chose ! Alors que de nombreuses méthodes d’étude de la transmission sociale ont été proposées au fil des années, l’analyse de diffusion basée sur les réseaux (NBDA), introduite pour la première fois dans Franz et Nunn 2009 et Hoppitt, Boogert et Laland 2010s’est imposé comme un cadre de référence.
Que sont les modèles NBDA ?
Les modèles NBDA partagent des similitudes avec les modèles de survie qu’un écologiste pourrait utiliser pour estimer la survie et ses corrélats. Cependant, plutôt que les événements de mortalité, nous mesurons les événements d’apprentissage, au cours desquels des individus sont observés en train de produire un nouveau comportement ou d’exploiter des informations utiles pour la première fois. À partir de là, nous pouvons estimer un taux d’apprentissage qui résulte de deux composantes, une composante « intrinsèque » asociale qui tient compte de l’apprentissage individuel, et une composante sociale, qui tient compte de l’apprentissage social par exposition à d’autres individus bien informés. Si vous disposez de données sur l’état des connaissances des individus au fil du temps et sur la fréquence à laquelle les individus d’une population interagissent les uns avec les autres, les modèles NBDA peuvent estimer si ces interactions augmentent le taux d’apprentissage.

Pour illustrer le principe de l’analyse de diffusion basée sur un réseau, utilisons un exemple idiot et centré sur l’humain. Disons qu’un scientifique intrépide participe à une fête à la maison et observe son amie, appelons-la Mary, ouvrir une bouteille de bière avec un briquet. La scientifique veut savoir comment elle a appris cette astuce utile, mais elle est trop timide pour le demander. Au lieu de cela, ils empruntent subrepticement son téléphone et appellent chaque contact pour lui demander s’ils savent également ouvrir des bouteilles avec un briquet. Aucun d’entre eux n’a la moindre idée de ce dont parle la scientifique, y compris sa famille et ses amis proches. Un ancien collègue affirme savoir comment faire, mais il a également demandé qui appelait, n’ayant rencontré Mary qu’une seule fois en passant. À partir de ces données, le scientifique déduirait que Mary a apparemment compris cela par elle-même. Dans un scénario alternatif, si le scientifique découvrait que son frère savait comment faire cela, tout comme sa meilleure amie, ils pourraient en déduire qu’elle l’avait appris d’eux. C’est fondamentalement ce que fait la NBDA : en tenant compte du timing des événements et des relations sociales entre les individus, le modèle déduit statistiquement quelle part du processus d’apprentissage a été pilotée par des essais et erreurs asociales, et quelle part était due à la transmission sociale.
Au fil des années, la NBDA a été élargie pour tenir compte de…
1. variables au niveau individuel (peut-être que Mary fume, ce qui la prédispose à avoir le briquet requis dans sa poche)
2. poids de transmission (Mary est beaucoup plus susceptible d’avoir appris de quelqu’un qui adopte ce comportement quotidiennement plutôt que mensuellement)
3. des réseaux dynamiques (si Mary a appris le truc alors qu’elle vivait au Québec, il est peu probable qu’elle l’ait appris des membres de sa famille en Floride)
4. comparaison de plusieurs réseaux (avec plus de données, le scientifique pourrait découvrir que ce comportement se propage plus fréquemment par l’intermédiaire des amis que de la famille)
… et ainsi de suite. La flexibilité de ce cadre, ainsi que sa traduction dans le Forfait RNBDA du co-auteur Will Hoppitt, en a fait un outil inestimable et largement appliqué dans les domaines de l’apprentissage social et de l’évolution culturelle.
Qu’est-ce que STbayes ajoute ?
Baies ST donne aux chercheurs un outil convivial pour effectuer des analyses bayésiennes NBDA et introduit également de nouvelles extensions au cadre. Les utilisateurs fournissent leurs données et STbayes génère et ajuste dynamiquement les modèles écrits sur le back-end dans Stanun langage statistique bayésien qui permet un ajustement de modèle plus efficace que d’autres langages statistiques, comme JAGS ou BUGS (si vous savez, vous savez). STbayes contient également des fonctionnalités utiles pour interpréter les sorties du modèle, effectuer des comparaisons de modèles et des contrôles prédictifs a posteriori. Cela réduit la barrière à l’entrée pour les codeurs moins expérimentés, car ils n’ont pas besoin d’apprendre Stan lui-même, et crée également un moyen rapide de prototyper des modèles pour les utilisateurs plus avancés qui peuvent ensuite modifier directement le code Stan. Le Vignette « Pour commencer » fournit une présentation pas à pas du pipeline pour un scénario de modélisation de base.
Au-delà du pipeline, STbayes ajoute quelques nouvelles extensions à NBDA. Le plus important est peut-être que les utilisateurs peuvent désormais profiter des résultats des modèles de réseau génératifs. Les limites du réseau peuvent être incluses sous forme de distributions plutôt que d’estimations ponctuelles, ce qui permet aux chercheurs de prendre en compte incertitude du réseau dans leur estimation de la transmission sociale. Les utilisateurs peuvent désormais facilement inclure différents effets par essai ou par individu (par exemple, certains individus peuvent être plus sensibles aux informations sociales que d’autres). En plus des réseaux dynamiques, les utilisateurs peuvent également fournir des poids de transmission dynamiques qui évoluent dans le temps. Enfin, STbayes prend en charge des probabilités de transmission complexes et introduit une paramétrisation numériquement plus stable de la transmission dépendante de la fréquence (inspirée de Fonction sigmoïde réglable de Dino Dini). Le Vignette « Recettes avancées » illustre comment utiliser ces différentes fonctionnalités.
L’histoire derrière STbayes
STbayes est lui-même un produit de recombinaison culturelle. Mes intérêts de recherche m’ont mis dans une position où j’ai été exposé à tous les ingrédients utilisés pour assembler le package, et ma formation en informatique m’a donné les compétences dont j’avais besoin pour l’exécuter. Au cours de mon doctorat avec Lucy Aplin à l’Institut Max Planck du comportement animal, je me suis familiarisé de manière exceptionnelle avec NBDA en travaillant aux côtés de Damien Farine et Sonja Wild, qui étaient tous des utilisateurs expérimentés et des contributeurs au cadre. En examinant la littérature, j’ai découvert que certaines études utilisaient la NBDA, tandis que d’autres utilisaient attraction pondérée par l’expérience (EWA) modèles d’apprentissage par renforcement, un cadre alternatif. Après avoir étudié leurs équations, j’ai réalisé que les deux pouvaient être combinés pour obtenir un modèle plus holistique d’évolution culturelle, comme la NBDA modélisait l’acquisition, tandis qu’EWA modélisait le choix. j’ai publié un modèle de simulation pour mieux comprendre les conséquences de la combinaison des deux, et a ensuite utilisé le modèle pour étudier comment les immigrants pourraient affecter l’évolution culturelle adaptative. J’ai temporairement mis NBDA de côté et j’ai continué à utiliser EWA pour étudier apprentissage social chez les mésanges charbonnières immigréesapprenant à utiliser Stan auprès de Brendan Barrett, qui a siégé à mon comité consultatif. Alors que j’ai commencé ma phase postdoctorale, le BRIN et Bison® des packages de modélisation de réseau générative ont été publiés. J’ai réalisé à quel point il pouvait être puissant de modéliser les bords sous forme de distributions plutôt que d’estimations ponctuelles, et j’ai pensé qu’il serait intéressant que cette approche puisse être combinée avec NBDA.
En tant que postdoctorant, je travaillais avec Fumihiro Kano à l’Université de Constance. L’étudiante de Kano, Mathilde Delacoux, avait mené une expérience étudiant la vigilance anti-prédatrice dans des troupeaux de pigeons, en utilisant un système de pointe qui enregistrait des données de suivi 3D à échelle fine de 100 Hz. Ils voulaient demander si les pigeons suivaient du regard pour localiser un prédateur. À un moment donné, j’ai réalisé que la question pouvait être résolue avec une NBDA. Mathilde a extrait toutes les données nécessaires des téraoctets d’informations de suivi. Pendant ce temps, j’ai bricolé un modèle Stan de plus en plus compliqué pour tester une myriade d’hypothèses alternatives avancées par Kano. En fin de compte, cela a permis d’inclure des réseaux dynamiques et des poids de transmission (sous-échantillonnés à 1 Hz), des variables au niveau individuel et des effets variables. Une fois que j’ai eu quelque chose qui semblait capable de récupérer les valeurs des paramètres des simulations, j’ai envoyé le code Stan à Will Hoppitt, un développeur clé du framework NBDA, et lui ai demandé s’il pouvait vérifier la probabilité et donner son avis. Il a gracieusement accepté, et après avoir discuté (et corrigé une partie importante de la probabilité que j’avais gâchée), nous sommes arrivés à la conclusion qu’il serait utile de mettre en place un package capable de créer automatiquement de tels modèles Stan, et c’est ainsi que STbayes a été conçu.
C’était la première fois que je créais un package R, et j’ai peut-être appris plus que ce que j’espérais grâce à cette expérience. Hadley Wickham tutoriel était inestimable. Bien sûr, cela en valait la peine. La science est itérative et collaborative. Vous êtes toujours debout sur les épaules des autres et je suis très reconnaissant envers tous ceux qui ont aidé tout au long de ce chemin.
Lire l’article complet ici.
Article édité par Standiwe Nomthandazo Kanyile.
