Constraints of using historical data for modelling the spatial distribution of helminth parasites in ruminants

Parasite. 2021;28:46. doi: 10.1051/parasite/2021042. Epub 2021 May 27.

Abstract

Dicrocoelium dendriticum is a trematode that infects ruminant livestock and requires two different intermediate hosts to complete its lifecycle. Modelling the spatial distribution of this parasite can help to improve its management in higher risk regions. The aim of this research was to assess the constraints of using historical data sets when modelling the spatial distribution of helminth parasites in ruminants. A parasitological data set provided by CREMOPAR (Napoli, Italy) and covering most of Italy was used in this paper. A baseline model (Random Forest, VECMAP®) using the entire data set was first used to determine the minimal number of data points needed to build a stable model. Then, annual distribution models were computed and compared with the baseline model. The best prediction rate and statistical output were obtained for 2012 and the worst for 2016, even though the sample size of the former was significantly smaller than the latter. We discuss how this may be explained by the fact that in 2012, the samples were more evenly geographically distributed, whilst in 2016 most of the data were strongly clustered. It is concluded that the spatial distribution of the input data appears to be more important than the actual sample size when computing species distribution models. This is often a major issue when using historical data to develop spatial models. Such data sets often include sampling biases and large geographical gaps. If this bias is not corrected, the spatial distribution model outputs may display the sampling effort rather than the real species distribution.

Title: Contraintes liées à l’utilisation de données historiques pour la modélisation de la distribution spatiale des helminthes parasites chez les ruminants.

Abstract: Dicrocoelium dendriticum est un trématode qui infecte les ruminants et nécessite deux hôtes intermédiaires différents pour terminer son cycle de vie. La modélisation de la distribution spatiale de ce parasite peut aider à améliorer sa gestion dans les régions à haut risque. L’objectif de cette recherche était d’évaluer les contraintes liées à l’utilisation d’ensembles de données historiques lors de la modélisation de la distribution spatiale des helminthes parasites chez les ruminants. Un ensemble de données parasitologiques fourni par CREMOPAR (Naples, Italie) et couvrant la majeure partie de l’Italie a été utilisé dans cet article. Un modèle de base (Random Forest, VECMAP®) utilisant l’ensemble des données a d’abord été utilisé pour déterminer le nombre minimal de points de données nécessaires pour construire un modèle stable. Ensuite, des modèles de distribution annuelle ont été calculés et comparés au modèle de référence. Le meilleur taux de prédiction et le meilleur résultat statistique ont été obtenus pour 2012 et le plus mauvais pour 2016, malgré le fait que la taille de l’échantillon du premier était nettement plus petite que celle du second. Nous discutons comment cela peut s’expliquer par le fait qu’en 2012, les échantillons étaient plus uniformément répartis géographiquement, alors qu’en 2016, la plupart des données étaient fortement regroupées. On conclut que la distribution spatiale des données d’entrée semble être plus importante que la taille réelle de l’échantillon lors du calcul des modèles de distribution des espèces. C’est souvent un problème majeur pour développer des modèles spatiaux quand on utilise des données historiques. Ces ensembles de données comportent souvent des biais d’échantillonnage et de grandes lacunes géographiques. Si ce biais n’est pas corrigé, les résultats du modèle de distribution spatiale peuvent représenter l’effort d’échantillonnage plutôt que la distribution réelle des espèces.

Keywords: Dicrocoelium dendriticum; Distribution; Italy; Prevalence; Ruminants; Spatial modeling.

MeSH terms

  • Animals
  • Dicrocoelium*
  • Helminths*
  • Italy / epidemiology
  • Parasites*
  • Ruminants