En exploitant la puissance de l’apprentissage automatique, les chercheurs ont construit un cadre permettant d’analyser les facteurs qui contribuent le plus significativement à la diversité génétique d’une espèce.
L’étude, récemment publiée dans la revue co-auteur de l’étude et professeur à évolution, écologie et biologie des organismes à l’Université d’État de l’Ohio. « L’IA nous permet de simuler des processus qui se produisent à la fois sur le plan écologique dans le présent et lors d’événements évolutifs lointains, et de comparer ces résultats aux données réelles que nous recueillons auprès de ces grenouilles. »
En raison de la quantité considérable de données mises à la disposition des généticiens et autres biologistes de la faune au cours des dernières décennies, il peut être difficile pour les chercheurs d’identifier des facteurs spécifiques qui pourraient être importants dans certaines expériences, a déclaré Carstens. Mais en intégrant de larges pans d’informations dans des simulations qui peuvent prendre en compte ces éléments dans une seule analyse, il est possible d’obtenir une chronique beaucoup plus complète du développement d’une espèce.
« Il faut beaucoup de temps pour construire et former nos modèles d’IA, mais nous en voulions un qui puisse capturer l’éventail des variations potentielles dans l’histoire des espèces d’une manière aussi fidèle que possible à ce que nous savions de la biologie du système », a déclaré Carstens.
Par exemple, bien que les espèces étudiées dans cette étude vivent dans la même région, il existe de nombreuses différences dans leur histoire naturelle. Bien que leurs œufs et leurs larves soient entièrement aquatiques, la grenouille sibulatrice se reproduit en continu tout au long de la saison des pluies et dans des chambres souterraines, tandis que les événements reproductifs du crapaud granuleux se produisent de manière explosive car elles dépendent de fortes précipitations.
Combinée à leur approche d’apprentissage automatique, la simulation des chercheurs a déterminé que leurs scénarios de modèles étaient étayés à 100 % en ce qui concerne les explications historiques de l’expansion de la grenouille sibilatrice, et à plus de 99 % pour celles du crapaud granuleux.
L’une des raisons pour lesquelles leur modèle est si précis est sa capacité à prendre en compte les événements démographiques récents, notamment en mesurant comment des événements tels que le développement humain ou le changement d’habitat peuvent avoir affecté la diversité génétique animale sur une longue période.
Mais même lorsqu’ils utilisent l’IA, les chercheurs doivent veiller à éviter les modèles trompeurs dans leurs résultats, a déclaré Carstens.
« Aucune analyse que nous effectuons ne pourra prendre en compte tous les facteurs qui ont été importants pour ces espèces au cours de millions d’années », a-t-il déclaré. « Nous devons donc tenir compte d’un éventail de possibilités sans pour autant élargir le champ des possibles au point que n’importe quel modèle puisse s’adapter aux données. »
Cela dit, alors que les progrès technologiques permettent aux chercheurs de répondre à des questions écologiques de niche et de tester de nouvelles hypothèses, leur travail est un précurseur de la création d’un cadre d’apprentissage automatique amélioré qui pourrait être appliqué à des enquêtes uniques sur d’autres espèces, a déclaré Carstens.
« Nous sommes susceptibles continuer « Nous utilisons différentes combinaisons de ces outils d’IA de différentes manières pour essayer de comprendre l’histoire de l’évolution », a déclaré Carstens. « Et à mesure que nous continuons à apprendre, les outils que nous utilisons changeront et évolueront pour devenir encore meilleurs. »
Emanuel M. Fonseca, qui a obtenu son doctorat à l’Ohio State en 2022, était l’un des co-auteurs de l’étude. L’étude a été soutenue par l’Ohio Supercomputer Center, la National Science Foundation des États-Unis et la Coordenação de Aperfeiçoamento de Pessoal de Nível Superior au Brésil.