Identifying Cases of Congestive Heart Failure From Administrative Data: A Validation Study Using Primary Care Patient Records

Chronic Dis Inj Can. 2013 Jun;33(3):160-6.
[Article in English, French]

Abstract

Introduction: To determine if using a combination of hospital administrative data and ambulatory care physician billings can accurately identify patients with congestive heart failure (CHF), we tested 9 algorithms for identifying individuals with CHF from administrative data.

Methods: The validation cohort against which the 9 algorithms were tested combined data from a random sample of adult patients from EMRALD, an electronic medical record database of primary care physicians in Ontario, Canada, and data collected in 2004/05 from a random sample of primary care patients for a study of hypertension. Algorithms were evaluated on sensitivity, specificity, positive predictive value, area under the curve on the ROC graph and the combination of likelihood ratio positive and negative.

Results: We found that that one hospital record or one physician billing followed by a second record from either source within one year had the best result, with a sensitivity of 84.8% and a specificity of 97.0%.

Conclusion: Population prevalence of CHF can be accurately measured using combined administrative data from hospitalization and ambulatory care.

Title: Repérage des cas d’insuffisance cardiaque congestive à partir de données administratives : étude de validation utilisant des dossiers de patients en soins primaires.

Introduction: En vue de déterminer si l’utilisation conjuguée des données administratives hospitalières et des factures présentées par les médecins au titre des soins ambulatoires pouvait permettre de repérer avec exactitude les patients souffrant d’insuffisance cardiaque congestive (ICC), nous avons mis à l’essai neuf algorithmes pour repérer à partir de données administratives les personnes souffrant d’ICC.

Méthodologie: La cohorte de validation par rapport à laquelle les essais ont été effectués combinait des données provenant d’un échantillon aléatoire de patients adultes inscrits dans la base de données EMRALD de dossiers médicaux électroniques des médecins de premier recours en Ontario, au Canada, et des données recueillies en 2004-2005 à partir d’un échantillon aléatoire de patients en soins primaires pour une étude sur l’hypertension. On a évalué la sensibilité, la spécificité, la valeur prédictive positive, l’aire sous la courbe ROC et la combinaison des rapports de vraisemblance positif et négatif des algorithmes.

Résultats: Nous avons constaté qu’un dossier d’hospitalisation ou de facturation de médecin suivi d’un second dossier provenant de l’une ou l’autre de ces sources dans la même année produisait les meilleurs résultats, avec une sensibilité de 84,8 % et une spécificité de 97,0 %.

Conclusion: Nous concluons que la prévalence de l’ICC dans la population peut être mesurée avec exactitude à partir de données administratives issues de l’hospitalisation et des soins ambulatoires.

Keywords: congestive heart failure; epidemiologic methods; population prevalence; validation studies.

Publication types

  • Research Support, Non-U.S. Gov't
  • Validation Study

MeSH terms

  • Algorithms*
  • Data Mining / methods*
  • Electronic Health Records*
  • Female
  • Heart Failure / epidemiology*
  • Humans
  • Male
  • Ontario / epidemiology
  • Prevalence
  • Primary Health Care*
  • Sensitivity and Specificity