The lack of knowledge about geographic distribution and environmental preference can hinder conservation efforts for rare and threatened species. Open-source databases provide an opportunity to address these knowledge gaps through the geographic information they hold on species worldwide. However, to protect rare and endangered species, open-source databases often assign locations that do not match the original locations, which introduce inaccuracies in occurrence records (e.g., the "obscured" function in iNaturalist replaces the original location with a random location in a 0.2 × 0.2° cell). We tested the efficacy of the iNaturalist's obscured function in concealing geographic information and the function's impact on the species distribution modeling of 3 endangered species in South Korea: gold-spotted pond frogs (Pelophylax chosenicus), Reeves' turtles (Mauremys reevesii), and Mongolia racerunner (Eremias argus). We collected occurrence data (orginal data) for these 3 species and uploaded the data to iNaturalist. We then compared location, elevation, and habitat area in the original data set with these data in the obscured data set. To investigate the differences in species distribution, we ran species distribution models with both data sets. We also assessed the awareness of obscured function in peer-reviewed articles for which occurrence records from iNaturalist were used. The locations assigned by the obscured function significantly altered the geographic information of the species, including elevational range, habitat type, and environmental variables relevant to species distribution. Potential distributions estimated using locations assigned under the obscured function were different from those estimated using the original data. Only 4 out of 170 peer-reviewed articles acknowledged the presence of obscured data in iNaturalist, suggesting that most researchers are unaware of this issue. The locations assigned by the obscured function can cause serious problems in species distribution modeling and thus may negatively affect conservation of endangered species. We encourage researchers to thoroughly vet data obtained from open-source databases and urge database platforms to make it clear when data have been obscured.
Impacto de los datos ocultos sobre los modelos de distribución de especies Resumen La falta de conocimientos sobre la distribución geográfica y las preferencias ambientales puede obstaculizar los esfuerzos de conservación de especies raras y amenazadas. Las bases de datos de código abierto ofrecen la oportunidad de colmar estos vacíos de conocimiento gracias a la información geográfica que contienen sobre especies de todo el mundo. Sin embargo, para proteger a las especies raras y amenazadas, las bases de datos de código abierto suelen asignar ubicaciones que no coinciden con las originales, lo que introduce imprecisiones en los registros de presencia (por ejemplo, la función «oculta» de iNaturalist sustituye la ubicación original por una ubicación aleatoria en una celda de 0.2 x 0.2 grados). Comprobamos la eficacia de la función oscurecida de iNaturalist para ocultar información geográfica y su impacto en los modelos de distribución de tres especies amenazadas en Corea del Sur: Pelophylax chosenicus, Mauremys reevesii y Eremias argus. Recopilamos los datos de localización de estas tres especies a partir de la bibliografía y los cargamos en iNaturalist. A continuación, comparamos la ubicación, la altitud y la superficie del hábitat en el conjunto de datos original con estos datos en el conjunto de datos oscurecido. Para investigar las diferencias en la distribución de las especies, ejecutamos modelos de distribución de especies con ambos conjuntos de datos. También evaluamos el conocimiento de la función de ocultamiento en artículos revisados por pares para los que se utilizaron registros de ocurrencia de iNaturalist. Las localizaciones asignadas por la función oculta alteraron significativamente la información geográfica de la especie, incluyendo el rango de elevación, el tipo de hábitat y las variables ambientales relevantes para la distribución de la especie. Las distribuciones potenciales estimadas que utilizaron las ubicaciones asignadas mediante la función de ocultamiento fueron diferentes a las estimadas utilizando los datos originales. Sólo 4 de 170 artículos revisados por pares reconocían la presencia de datos ocultos en iNaturalist, lo que sugiere que la mayoría de los investigadores desconocen este problema. Las localizaciones asignadas por la función oculta pueden causar graves problemas en los modelos de distribución de las especies y, por tanto, pueden afectar negativamente a la conservación de especies amenazadas. Alentamos a los investigadores a que examinen minuciosamente los datos obtenidos de bases de datos de código abierto e instamos a las plataformas de bases de datos a que dejen claro cuándo se han ocultado los datos.
Keywords: GBIF; biodiversity data; datos de biodiversidad; ecological model; estado de geoprivacidad; geoprivacy status; imprecisión posicional; modelo ecológico; positional inaccuracy.
© 2025 The Author(s). Conservation Biology published by Wiley Periodicals LLC on behalf of Society for Conservation Biology.