Fermer

20/03/2024

Augmenter l’accès, la reproductibilité et la transparence dans les analyses phylogénétiques avec Cristian Román-Palacios – Blog Méthodes


Photo de Cristian Román-Palacios

Je suis né dans les Andes colombiennes (Arménie, Quindío) dans les années 90. J’ai obtenu mon baccalauréat en biologie à l’Universidad del Valle, à Cali, en Colombie, en 2015. J’ai déménagé aux États-Unis en 2016 pour poursuivre un doctorat. en écologie et biologie évolutive à l’Université de l’Arizona – un diplôme que j’ai obtenu à l’automne 2020. Bien que mes intérêts de recherche semblent avoir changé au fil du temps, la plupart du temps, mon objectif principal a été de répondre à des questions de longue date et d’utiliser méthodes pour poser des questions principalement en biologie à partir de perspectives nouvelles.

En tant qu’étudiant de premier cycle, mes recherches se sont concentrées sur la description des espèces d’insectes dans les régions néotropiques et sur la réalisation d’analyses sur l’écologie trophique et reproductive de certaines espèces de poissons d’eau douce en Colombie. C’est à ce moment-là que j’ai pris conscience de la beauté de la programmation, des méthodes statistiques, de leur potentiel intrinsèque en biologie et de leur flexibilité. J’étais particulièrement concentré sur l’exploration de la comparaison multimodèle et des algorithmes fondamentaux d’apprentissage automatique d’un point de vue appliqué. J’étais également conscient que la biologie évolutive, et en particulier la phylogénétique, était un domaine fédérateur de la biologie et des disciplines connexes.

En tant qu’étudiant au doctorat, j’avais l’intention d’équilibrer mon travail entre mes intérêts de recherche directs (par exemple, les méthodes comparatives phylogénétiques), la recherche plus appliquée (par exemple, le changement climatique et la biodiversité) et les travaux qui devaient soutenir les générations futures de scientifiques (par exemple, articles de blog dans Nature ; https://doi.org/10.1038/d41586-019-00845-z). C’est cette combinaison de perspectives qui m’a le plus intéressé à cette étape de ma carrière.

J’ai récemment publié un package R visant à augmenter la reproductibilité et l’accès aux outils souvent utilisés pour déduire des phylogénies moléculaires. Le package phruta R a été révisé et publié pour la première fois par ROpenSci en 2022. L’article associé dans Methods in Ecology and Evolution a été publié début 2023. J’ai cependant commencé à travailler sur ce package vers la fin de la première année de mon doctorat en 2017. Les premiers travaux de phruta concernent PhyLoTA, car mon objectif était de ramener certaines des fonctionnalités d’origine de cette base de données à travers deux packages : muPHY et rPHYLOTA. À cette époque, je prévoyais également de travailler en rotation dans le laboratoire de Mike Sanderson, également à l’UArizona (auteur de r8s, PhyLoTA). Pour ma rotation, nous avons fini par collaborer sur un projet plus petit axé sur la comparaison des taux d’évolution moléculaire en fonction de traits particuliers du cycle de vie des plantes.

J’ai avancé dans la mise en œuvre de ce package, principalement vers la fin de mon doctorat. Les principales fonctions du package phruta R permettent une extraction et une conservation rapides des séquences GenBank. Ce package est conçu pour les étudiants et les chercheurs intéressés par l’assemblage d’ensembles de données génétiques au niveau des espèces pour des ensembles particuliers de taxons. Phruta permet également des procédures d’inférence phylogénétique de base. Cependant, je souligne souvent que les fonctionnalités de phruta sont encore limitées compte tenu de la vaste gamme d’outils qui pourraient être utilisés à chaque étape du flux de travail phylogénétique. Il existe des plans à long terme pour améliorer les routines de conservation et de récupération de données, ainsi que pour prendre en charge des outils supplémentaires pour l’alignement des séquences et l’inférence d’arbres.

J’ai ouvert mon propre laboratoire à l’automne 2023, également à l’Université de l’Arizona. Phruta représente l’une des branches de la recherche effectuée en laboratoire (c’est-à-dire le développement de logiciels). Comme excuse pour être professeur dans une unité académique interdisciplinaire sur le campus (École d’information), la recherche et le travail en laboratoire se chevauchent également avec la biologie, l’apprentissage automatique, la science des données et la DEI. J’accueille favorablement la collaboration sur des efforts synergiques avec les professeurs et les étudiants.

Vous pouvez lire l’article complet sur le package R Phruta ici





Source link