Two-stage designs for gene-disease association studies

Biometrics. 2002 Mar;58(1):163-70. doi: 10.1111/j.0006-341x.2002.00163.x.

Abstract

The goal of this article is to describe a two-stage design that maximizes the power to detect gene-disease associations when the principal design constraint is the total cost, represented by the total number of gene evaluations rather than the total number of individuals. In the first stage, all genes of interest are evaluated on a subset of individuals. The most promising genes are then evaluated on additional subjects in the second stage. This will eliminate wastage of resources on genes unlikely to be associated with disease based on the results of the first stage. We consider the case where the genes are correlated and the case where the genes are independent. Using simulation results, it is shown that, as a general guideline when the genes are independent or when the correlation is small, utilizing 75% of the resources in stage 1 to screen all the markers and evaluating the most promising 10% of the markers with the remaining resources provides near-optimal power for a broad range of parametric configurations. This translates to screening all the markers on approximately one quarter of the required sample size in stage 1.

Le but de cet article est de décrire une stratégie d’étude à deux étapes qui maximise la puissance de détection d’associations gène-maladie quand la principale contrainte est le coût total, représenté par le nombre total d’évaluations de gènes plutôt que le nombre total d’individus. Dans la première étape, tous les gènes d ‘intérêt sont évalués sur un sous-groupe d’individus. Les gènes les plus prometteurs sont alors évalués sur d’autres sujets dans la deuxième étape. Ceci évitera de gaspiller du matériel sur des gènes ayant une faible probabilité d’être associés à la maladie d’après les résultats de la première étape. Nous envisageons le cas où les gènes sont corrélés et celui où les gènes sont indépendants. A l’aide de simulations, nous montrons qu’en règle générale, lorsque les gènes sont indépendants ou faiblement corrélés, utiliser 75% du matériel dans l’étape 1 pour tester tous les marqueurs et ne tester que les 10% plus prometteurs avec le matériel restant apporte une puissance quasi optimale pour une large étendue de configurations paramétriques. Ceci revient à tester tous les marqueurs sur environ un quart de l’échantillon nécessaire à l’étape l.

Publication types

  • Research Support, U.S. Gov't, P.H.S.

MeSH terms

  • Breast Neoplasms / genetics*
  • Case-Control Studies
  • Computer Simulation
  • Female
  • Genes, BRCA1
  • Genes, BRCA2
  • Genetic Testing / economics
  • Germ-Line Mutation
  • Humans
  • Models, Genetic*
  • Polymorphism, Single Nucleotide / genetics
  • Risk