Rofo 2020; 192(S 01): S84-S85
DOI: 10.1055/s-0040-1703360
Vortrag (Wissenschaft)
Thoraxradiologie
© Georg Thieme Verlag KG Stuttgart · New York

Evaluation der diagnostischen Genauigkeit von Machine Learning für die Detektion von Lungenrundherden in der Thoraxradiografie

M Lodde
1   Klinikum rechts der Isar der Technischen Universität München, Institut für Diagnostische und Interventionelle Radiologie , München
,
S Schober
2   Technische Universität München, Physik-Department, München
,
M Schultheiss
2   Technische Universität München, Physik-Department, München
,
C Müller-Leisse
3   Klinikum rechts der Isar der Technischen Universität München, Diagnostische und Interventionelle Radiologie, München
,
J Aichele
3   Klinikum rechts der Isar der Technischen Universität München, Diagnostische und Interventionelle Radiologie, München
,
J Bodden
4   Klinikum rechts der Isar der Technischen Universität München, Diagnostische und Interventionelle Radiologie , München
,
F Pfeiffer
2   Technische Universität München, Physik-Department, München
,
E Rummeny
5   Klinikum rechts der Isar der Technischen Universität München, Diagnostische und Interventionelle Radiologie, München
,
D Pfeiffer
3   Klinikum rechts der Isar der Technischen Universität München, Diagnostische und Interventionelle Radiologie, München
› Author Affiliations
Further Information

Publication History

Publication Date:
21 April 2020 (online)

 

Zielsetzung Untersuchung des Potenzials von Machine Learning Algorithmen zur Erkennung von Lungenrundherden in Röntgenaufnahmen des Thorax.

Material und Methoden Es wurden insgesamt 521 Thoraxröntgenbilder (n = 452 mit Lungenrundherden, n = 69 als gesunde Kontrolle) analysiert. 428 dienten zum Anlernen der Algorithmen, 18 zur Validierung und 75 Thoraxröntgenbilder als Testdatensatz. Zwei verschiedene Techniken, das U-Net und das RetinaNet, wurden genauer betrachtet. Hierbei wurden entweder Segmentierungs- oder Bounding-Box-Labels verwendet. Im Rahmen einer Readerstudie evaluierten zwei Radiologen (mit jeweils 4 und 6 Jahren Erfahrung) die Röntgenbilder mit einem Zeitlimit von 10s/Bild und wurden gebeten, alle Tumore entsprechend zu markieren. Zum Vergleich der diagnostischen Genauigkeit zwischen Algorithmen und Radiologen wurde das Verhältnis aus detektierten Tumoren zur Gesamtzahl der Tumore, sowie der entsprechende F2-Score bezogen auf den Testdatensatz berechnet.

Ergebnisse Radiologe A entdeckte 69,4% aller vorhandenen Tumore in der Readerstudie und erzielte einen F2-Score von 0,672. Radiologe B entdeckte 62,9% aller Tumore, was einem F2-Score von 0,615 entspricht. Das beste RetinaNet-Modell identifizierte die gleiche Anzahl an Tumoren wie Radiologe B mit einem F2-Score von 0,606. 56,5% aller Tumoren wurden vom U-Net-Modell erkannt und somit erreichte dieses einen F2-Score von 0,547; Das RetinaNet- und das U-Net-Modell detektierten jedoch 7 bzw. 6 der insgesamt 15 Tumore, die von den Radiologen übersehen wurden.

Schlußfolgerungen Im Vergleich zu den an der Readerstudie beteiligten Radiologen erzielten die Algorithmen eine ähnlich gute Leistung innerhalb der Untersuchungen. Infolgedessen bestätigen die Ergebnisse die Behauptung, dass moderne neuronale Netze in der Lage sind, das Screening auf Lungenrundherde in Röntgenaufnahmen des Thorax zu erlernen. Somit könnte die Anzahl korrekt identifizierter Tumore mithilfe einer Kombination aus menschlicher und rechnerischer Bewertung erhöht werden.