A note on the use of the non-parametric Wilcoxon-Mann-Whitney test in the analysis of medical studies

Ger Med Sci. 2008 Apr 7:6:Doc02.

Abstract

Background: Although non-normal data are widespread in biomedical research, parametric tests unnecessarily predominate in statistical analyses.

Methods: We surveyed five biomedical journals and - for all studies which contain at least the unpaired t-test or the non-parametric Wilcoxon-Mann-Whitney test - investigated the relationship between the choice of a statistical test and other variables such as type of journal, sample size, randomization, sponsoring etc.

Results: The non-parametric Wilcoxon-Mann-Whitney was used in 30% of the studies. In a multivariable logistic regression the type of journal, the test object, the scale of measurement and the statistical software were significant. The non-parametric test was more common in case of non-continuous data, in high-impact journals, in studies in humans, and when the statistical software is specified, in particular when SPSS was used.

Hintergrund: In biomedizinischen Studien ist die Annahme einer Normalverteilung der Daten oft nicht vertretbar. Trotz geeigneterer alternativer Testverfahren werden in solchen Studien sehr häufig parametrische Tests zur Datenanalyse eingesetzt.

Methoden: Wir untersuchten Studien aus fünf medizinischen Zeitschriften, welche den t-test für unverbundene Stichproben und/oder den nichtparametrischen Wilcoxon-Mann-Whitney Test enthielten. Das Ziel war es, Zusammenhänge zwischen der Wahl eines parametrischen oder nichtparametrischen Tests und anderen Faktoren einer Studie, wie zum Beispiel Zeitschriftentyp, Fallzahl, Randomisierung oder Sponsoring, nachzuweisen.

Ergebnisse: Der nichtparametrische Wilcoxon-Mann-Whitney-Test wurde in 30% der Studien verwendet. In einer multivariablen logistischen Regression waren die Variablen Zeitschriftentyp, Versuchseinheit, Skalenniveau und Statistiksoftware signifikant. Der Wilcoxon-Mann-Whitney-Test wurde besonders häufig dann eingesetzt, wenn die Daten nicht stetig waren, die Zeitschrift einen hohen Impactfaktor vorwies, in Studien, welche am Menschen durchgeführt wurden, und wenn die Statistiksoftware (besonders SPSS) benannt wurde.