Zielsetzung Untersuchung des Einflusses eines in den Segmentierungsablauf integrierten Qualitätssicherungsprotokolls
(QAP) auf die Genauigkeit und Konsistenz der Lungensegmentierung in CT-Scans. Ziel
war es, die Segmentierungsgenauigkeit und -Konsistenz zu überwachen und so die Qualität
von Trainingsdatensätzen zu sichern.
Material und Methoden In dieser retrospektiven Multicenter-Studie, Teil des RACOON-Projekts, nahmen 73
Segmentierende aus 36 Kliniken teil. Sie führten voxelgenaue Segmentierungen (Labels:
Milchglas-Trübung [GGO], Konsolidierung [CONS]) in drei Runden (R1: 0%, R2: 50%, R3:
100%) durch. Die Segmentierungen wurden auf Genauigkeit und Inter-Reader Konsistenz
evaluiert (Dice-Koeffizienten und RMSD). Eine Umfrage bewertete die Erfahrungen der
Leser. Statistische Analyse erfolgte mittels lineare mixed Modells.
Ergebnisse Zwischen Juli 2021 und Juni 2022 wurden 2961 Bildserien im gesamten Datensatz annotiert,
von denen 519 im Rahmen unseres QAP analysiert wurden (R1: 205, R2: 171, R3: 143).
Die meisten Segmentierenden (57%) hatten geringe Segmentierungserfahrung (mittlere
Erfahrung: 25%, Experten: 17%). Die Segmentierungsperformance für beide Labels verbesserte
sich über die Zeit, wobei der mittlere SDC von 0,376±0,214 auf 0,584±0,340 für GGO
(p<0,0001) und von 0,313±0,301 auf 0,556±0,311 für CONS (p<0,0001) anstieg. Auch die
RMSD-Verbesserungen waren für GGO signifikant (von 8,18±3,28 auf 6,04±6,47, p<0,0001)
und für CONS (von 4,83±2,25 auf 3,96±4,25, p=0,0009). Die durchschnittliche Zeit verringerte
sich um 25% (von 96,6±77,5 Min. auf 78,01±65,9 Min., p=0,02558). Es bestand keine
signifikante Korrelation zwischen der vorherigen Segmentierungserfahrung und der Qualitätsverbesserung
für GGO (p=0,9622) und CONS (p=0,9685).
Schlussfolgerungen Ein integriertes QAP liefert wertvolle Qualitätsmetriken und reduziert die Abhängigkeit
von Expertenüberprüfungen. In multizentrischen Studien sichert ein QAP effektiv die
Datenqualität und unterstützt die kontinuierliche Überwachung der Segmentierungsleistung.