Purpose: To assess the interrater agreement and reliability of experienced abdominal radiologists in the characterization and grading of arterial phase gadoxetate disodium-related respiratory motion artifact on liver MRI.
Materials and methods: This prospective multicenter study was initiated by the working group for abdominal imaging within the German Roentgen Society (DRG), and approved by the local IRB of each participating center. 11 board-certified radiologists independently reviewed 40 gadoxetate disodium-enhanced liver MRI datasets. Motion artifacts in the arterial phase were assessed on a 5-point scale. Interrater agreement and reliability were calculated using the intraclass correlation coefficient (ICC) and Kendall coefficient of concordance (W), with p < 0.05 deemed significant.
Results: The ICC for interrater agreement and reliability were 0.983 (CI 0.973 - 0.990) and 0.985 (CI 0.978 - 0.991), respectively (both p < 0.0001), indicating excellent agreement and reliability. Kendall's W for interrater agreement was 0.865. A severe motion artifact, defined as a mean motion score ≥ 4 in the arterial phase was observed in 12 patients. In these specific cases, a motion score ≥ 4 was assigned by all readers in 75 % (n = 9/12 cases).
Conclusion: Differentiation and grading of arterial phase respiratory motion artifact is possible with a high level of inter-/intrarater agreement and interrater reliability, which is crucial for assessing the incidence of this phenomenon in larger multicenter studies.
Key points: · Inter- and intrarater agreement for motion artifact scoring is excellent among experienced readers.. · Interrater reliability for motion artifact scoring is excellent among experienced readers.. · Characterization of severe motion artifacts proved feasible in this multicenter study..
Citation format: · Ringe KI, Luetkens JA, Fimmers R et al. Characterization of Severe Arterial Phase Respiratory Motion Artifact on Gadoxetate Disodium-Enhanced MRI - Assessment of Interrater Agreement and Reliability. Fortschr Röntgenstr 2017; 190: 341 - 347.
ZIEL: Evaluation der Interreader-Übereinstimmung und -Reliabilität zwischen erfahrenen Radiologen im Hinblick auf die Beurteilung und Graduierung atemabhängiger Artefakte in der Leber-MRT mit Gd-EOB-DTPA.
Material und methoden: In dieser prospektiven Multizenterstudie (initiiert durch die AG Gastrointestinal- und Abdominaldiagnostik der DRG) wurden Gd-EOB-DTPA verstärkte MRT-Untersuchungen von 40 Patienten (25 Männer, 15 Frauen; mittleres Alter 59 Jahre) durch 11 erfahrene Radiologen/innen aus Deutschland und der Schweiz ausgewertet. Evaluiert wurden das Auftreten und der Schweregrad atemabhängiger Artefakte in der arteriellen Phase der KM-Dynamik anhand eines 5-Punkte Scores. Zur Beurteilung von Übereinstimmung und Reliabilität des Scorings zwischen den Radiologen wurden der Intraklassen-Korrelationskoeffizient (ICC) und der Kendall Konkordanzkoeffizient (W) berechnet.
Ergebnisse: Die Übereinstimmung zwischen den Radiologen bezüglich der Graduierung des Schweregrads des Artefakts war mit einem ICC von 0,933 (95 % Konfidenzintervall 0,973 – 0,990; p < 0,0001) bzw. einem Kendall W von 0,865 sehr gut. Die Reliabilität bzgl. der Unterscheidung verschiedener Schweregrade war zwischen den Radiologen ebenfalls sehr gut mit einem ICC von 0,985 (95 % Konfidenzintervall 0,978 – 0,991; p < 0,0001). Schwere atemabhängige Artefakte (definiert als ein Score ≥ 4) wurden in 12 Untersuchungen beobachtet. In diesen Fällen wurde in 75 % (9/12) von allen Radiologen ein Score ≥ 4 vergeben.
Schlussfolgerung: Die Differenzierung und Charakterisierung atemabhängiger Artefakte in der arteriellen Phase der MRT mit Gd-EOB-DTPA durch verschiedene Radiologen ist mit hoher Übereinstimmung und Reliabilität möglich. Die zuverlässige und übereinstimmende Bewertung von Artefakten durch unterschiedliche Radiologen ist eine unabdingbare Voraussetzung für die Durchführung großer Multizenterstudien. Die Ergebnisse dieser Arbeit schaffen hierfür die Grundlage.
Kernaussagen: · Die Inter- und Intraraterübereinstimmung für die Beurteilung atemabhängiger Artefakte ist sehr gut.. · Die Interrater Reliabilität unter erfahrenen Radiologen bezüglich der Graduierung von atemabhängigen Artefakten ist sehr gut.. · Die Charakterisierung schwerer atemabhängiger Artefakte erwies sich in dieser Multizenterstudie als zuversichtlich möglich..
© Georg Thieme Verlag KG Stuttgart · New York.