Ceci est le repost d’un article que nous avons écrit pour le blog d’Ecography
En 1990, Stuart H. Hurlbert a analysé la “Distribution Spatiale de la Licorne de Montagne”. La Licorne de Montagne était une espèce rare, qui n’avait était décrite que très récemment, et Hurlbert était le premier à signaler des données sur cette espèce spéciale. Ses données montraient que les populations de licornes avaient leurs distributions d’abondance très bizarres et hétérogènes. Il les a donc analysé avec les méthodes les plus reconnues à l’époque, à savoir le ratio « moyenne:variance ». En effet, on admettait à l’époque que lorsque ce ratio variance:moyenne était égal à 1, alors les distributions d’abondances suivaient une loi de Poisson. Pourtant, de manière surprenante, Hurlbert montra qu’aucune de ses populations de licorne ne suivait une loi de Poisson, mais toutes avaient un ratio variance:moyenne égal à un, prouvant alors que le ratio variance:moyenne était inutile comme mesure de l’agrégation des populations.
Stuart H. Hurlbert a eu l’idée brillante de simuler des données pour invalider une croyance de longue date en écologie statistique. L’écologie est une science construite sur la base de données échantillonnées sur le terrain, à partir desquelles les écologues font des hypothèses qu’ils testent avec des méthodes statistiques. Cependant, toutes les méthodes statistiques ne sont pas complètement comprises, ou correctement appliquées par les écologues. Par conséquent, les modèles ne modélisent pas toujours ce qu’on croit qu’ils modélisent, ou leurs résultats ne signifient pas toujours ce qu’on croit qu’ils signifient. Dans de tels cas, les données simulées peuvent aider à valider ou invalider nos hypothèses sur les modèles.
Cette approche générale de simulation serait probablement appelée l’approche de « l’Ecologiste Virtuel » en écologie moderne (Zurell et al. 2010). Plusieurs domaines de l’écologie (biogéographie, écologie des changements climatiques, biologie des invasions, biologie de la conservation) utilisent intensément des modèles pour prédire les répartitions d’espèces. Ces modèles, appelés modèles de prédiction de répartition d’espèces (SDMs) (également appelés modèles de niche écologiques ou modèles d’habitats) relient statistiquement des données d’occurrence d’espèces avec des variables environnementales pour prédire les répartitions potentielles d’espèces. L’essor des SDMs dans la littérature a abouti au développement d’une pléthore d’outils, méthodes et protocoles. Savoir quelles approches modélisent le mieux les répartitions d’espèces est un challenge que de nombreux écologues ont abordé avec des données d’espèces échantillonnées. Cependant, les données échantillonnées souffrent de nombreux biais (e.g., données incomplètes, biais spatial, erreurs d’identifications, détection inadéquate) qui empêchent la généralisation de ces tentatives de validation. Par conséquent, les écologues ont décidé de commencer à modéliser des licornes dans la dernière décénie, et ont commencé à simuler des espèces virtuelles afin de valider leurs hypothèses sur les SDMs, tester leurs performances, ainsi que les effets de différents biais.
Ainsi, les espèces virtuelles deviennent un outil commun dans la littérature sur les SDMs. Cependant, modéliser les licornes n’est pas une tâche aisée, car cela requière d’importantes compétences de programmation, et il n’existait pas de logiciel ou package complet et « user-friendly » jusque récemment. En outre, si elles n’étaient pas planifiés correctement, les licornes simulées pouvaient également mener à de mauvaises conclusions. Meynard et Kaplan (2013) ont par exemple montré qu’une simulation inadéquate pouvait mener à une forte surestimation de la précision des SDMs, et Moudrý (2015) a creusé encore plus profondément dans les problèmes liées à l’utilisation de simulations inappropriées. Par conséquent, nous avons décidé d’aider la communauté écologique à simuler adéquatement les licornes, en proposant un package R complet et user-friendly nommé « virtualspecies ». virtualspecies combine les approches méthodologiques existantes dans un framework complet, avec l’objectif de générer des répartitions d’espèces virtuelles avec un réalisme écologique accru.
Ce package est décrit dans notre article récent Leroy B., Meynard, C.N., Bellard C. & Courchamp F. 2015. virtualspecies: an R package to generate virtual species distributions. Ecography. Il est disponible gratuitement, et un tutoriel complet est aussi disponible ici : http://borisleroy.com/en/virtualspecies/.