Ultraschall Med 2024; 45(01): 8-12
DOI: 10.1055/a-2171-2674
Editorial

Ultraschalldiagnostik des hepatozellulären Karzinoms: In Zukunft nur mit künstlicher Intelligenz?

Article in several languages: English | deutsch
Maximilian J. Waldner
Medical Clinic 1, Erlangen University Hospital, Erlangen, Germany
,
Deike Strobel
Medical Clinic 1, Erlangen University Hospital, Erlangen, Germany
› Author Affiliations
 

Einleitung

Technologischer Fortschritt und die Entwicklung komplexer mathematischer Modelle, welche die Analyse großer und teilweise unstrukturierter Daten erlauben, führten seit den 2010er-Jahren zu einer rasanten Weiterentwicklung der künstlichen Intelligenz (KI) [1]. Regelmäßig bekommen neue KI-Anwendungen, wie zuletzt der „Chatbot“ ChatGPT, eine hohe mediale Aufmerksamkeit – mit euphorischen bis hin zu kritischen Schlagzeilen. Entsprechend entwickelten sich in der Bevölkerung konkrete Erwartungen an den Nutzen, aber auch Bedenken aufgrund möglicher Gefahren der KI. In einer 2023 veröffentlichten Umfrage des Digitalverbands Bitkom sahen 73 % der 1007 befragten Personen KI als Chance [2]. Zwei Drittel wünschten sich den Einsatz der KI, wenn er einen konkreten Nutzen bringt, etwa in der Medizin oder im Verkehr. Jeweils 14 % und 10 % der Befragten sahen KI eher oder ausschließlich als Gefahr. Überwiegend gingen die Befragten davon aus, dass KI unsere Gesellschaft in den kommenden Jahren spürbar verändern werde. Diese Umfragewerte zeigen eindrucksvoll, wieviel der KI bereits zugetraut wird. Und tatsächlich begleitet uns KI bereits bewusst oder unbewusst in vielen Alltagssituationen. Entsprechende Beispiele gibt es auch in der klinischen Medizin, z. B. bei der automatisierten Auswertung von EKGs, Differentialblutbildern etc. [1]. Auch an einem möglichen Einsatz der KI in der medizinischen Bildgebung wurde seit deren Anfängen vor über 80 Jahren intensiv geforscht. Dazu zählt neben Ansätzen zur Bildoptimierung in erster Linie die automatisierte Befunderhebung zur Krankheitserkennung und -klassifizierung sowie zum therapeutischen Monitoring. Durch den Einsatz sogenannter Deep-Learning--Technologien (kurz: DL-Technologien) wurden im Bereich der Bildgebung in den vergangenen Jahren enorme Fortschritte erzielt. Im Gegensatz zu klassischen Formen des maschinellen Lernens (ML) basiert DL auf neuronalen Netzen, bei denen mehrere Netzwerkebenen miteinander verknüpft werden [3]. Für einen Einsatz bei der Bilderkennung werden häufig Convolutional Neuronal Networks (CNNs) eingesetzt. Diese zeichnen sich durch eine hierarchische Erkennung von Bildmustern durch die verschiedenen Netzwerkebenen aus [3]. Werden initial Strukturen wie Ecken, Kanten oder einfache Formen erkannt, ermöglicht die Verknüpfung dieser einfachen Strukturen in den tieferen Netzwerkebenen die Klassifizierung komplexer Strukturen, wie z. B. von Malignomen, in der klinischen Bildgebung. Neben einer besseren Vorhersagekraft besitzen CNNs im Vergleich zum klassischen ML eine höhere Flexibilität. Zusätzlich entfällt die beim klassischen ML notwendige und zeitaufwendige Extrahierung diagnostisch relevanter Bildinformationen („feature extraction“), da diese Bildmerkmale durch CNNs selbstständig erkannt werden.

Besonders in der radiologischen Bildgebung (u. a. in der Computertomografie und der Magnetresonanztomografie) konnten mithilfe von CNNs herausragende Ergebnisse in der klinischen Diagnostik und beim Therapie-Monitoring erzielt werden. Diese führten bereits zu verschiedenen kommerziell verfügbaren und zugelassenen KI-Applikationen, u. a. im Bereich der onkologischen Bildgebung [4].

Zoom Image
Abb. 1 Einsatz der Künstlichen Intelligenz (KI) in der onkologischen Bildgebung. Bisherige Studien untersuchten einen möglichen Einsatz der KI bei der Erkennung (Detection), Charakterisierung (Characterization) und beim therapeutischen Monitoring onkologischer Erkrankungen. Abbildung modifiziert nach El Naqa et al., Br J Radiol, 2020 [5].

Im Vergleich zur radiologischen Bildgebung bringt der Einsatz der KI in der sonografischen Bildgebung besondere Herausforderungen mit sich [6]. Aufgrund der Untersucherabhängigkeit bei der Bilderfassung in der Sonografie verfügt mögliches Bildmaterial für das Training einer KI in der Regel über eine höhere Variabilität. Die Darstellung des identischen Befundes in unterschiedlichen Schnittebenen kann z. B. bereits zu erheblichen Unterschieden bei der Bildinterpretation führen und damit eine korrekte Klassifizierung durch die KI erschweren. Ähnliche Effekte können durch Unterschiede der verwendeten Geräte oder Schallköpfe hervorgerufen werden.

Inwiefern sich diese Effekte auf den Einsatz der KI in der Sonografie auswirken, wo die KI in der Sonografie aktuell steht, mit welchen Einschränkungen zu rechnen ist und welche Schritte als nächstes nötig sind, um eine erfolgreiche Translation der KI in die klinische Sonografie zu ermöglichen, werden wir im Folgenden am Beispiel der sonografischen Diagnostik des hepatozellulären Karzinoms (HCC) diskutieren.


#

KI zur Früherkennung und Charakterisierung fokaler Leberläsionen in der sonografischen Bildgebung

Die Inzidenz maligner Lebertumore hat in den vergangenen Jahrzehnten kontinuierlich zugenommen. Das primäre Leberzellkarzinom (HCC) ist hierbei der weltweit häufigste maligne Lebertumor, in der westlichen Welt vor allem aufgrund chronischer HCV-Infektion-bedingter oder alkoholbedingter Leberzirrhosen und der Zunahme der mit einer metabolischen Dysfunktion assoziierten Fettleber-Erkrankungen (MASLD), mit fortgeschrittener Fibrose oder Zirrhose [7] [8]. Aus diesem Grund empfehlen die verschiedenen Fachgesellschaften Patienten mit erhöhtem HCC-Risiko die Teilnahme an einem Früherkennungsprogramm, basierend auf halbjährlichen Ultraschall-Untersuchungen der Leber [8] [9].

Die Sensitivität der B-Bild-Sonografie für die HCC-Früherkennung wird mit Werten zwischen 47 und 84 % angegeben [10]. Als Gründe für die große Variabilität der Sensitivität gelten die Erfahrung des Untersuchers, unzureichende Schallbedingungen bei sehr adipösen Patienten oder die inhomogene Echotextur der Leberzirrhose. Während die Sonografie bei größeren Läsionen eine vergleichbare Detektionsrate wie die Computertomografie (CT) und die Magnetresonanztomografie (MRT) aufweist, liegt die Sensitivität der Sonografie deutlich unter der MRT, wenn es um die Erkennung kleiner Läsionen (< 2 cm) gehts. Es stellt sich die Frage, ob der Einsatz KI-gestützter Verfahren in der Sonografie zu einer verbesserten Detektion von HCC-Frühformen führen kann.

Bislang veröffentlichte Studien untersuchten in erster Linie die Möglichkeit, mithilfe der KI fokale Leberläsionen in sonografischen Bilddaten zu erkennen. So trainierten Tiyarattanachai et al. ein CNN mit mehr als 20 000 Einzelbildern aus den B-Bild-Sonografien von knapp 3500 Patienten [11]. Die Autoren erzielten dabei eine Sensitivität von 83,9 % für die Erkennung fokaler Leberläsionen in einem internen und 84,9 % in einem externen Validierungsdatensatz. Yang et al. erzielten mit einem CNN, welches Anhand von über 20 000 Ultraschallbildern von mehr als 2000 Patienten, in Verbindung mit klinischen Informationen (u. a. Alter, Geschlecht, AFP-Wert) trainiert wurde, eine Sensitivität von 86,5 % und eine Spezifität von 85,5 % [12]. Das CNN war in dieser Studie gegenüber erfahrenen Untersuchern überlegen und erzielte ähnliche Ergebnisse wie eine kontrastmittelverstärkte Computertomografie.

Wird eine HCC-suspekte Läsion im Rahmen der Surveillance erkannt, sollte diese nach den Leitlinien-Empfehlungen durch ein kontrastmittelgestütztes Verfahren charakterisiert werden [8]. Zur HCC-Diagnostik kann neben der kontrastmittelverstärkten Magnetresonanztomografie (MRT) und der Computertomografie (CT) auch die kontrastmittelverstärkte Sonografie (CEUS) eingesetzt werden [13]. Wie die Daten der prospektiven DEGUM-Multicenter-Studie zeigen, erlaubt ein typisches Perfusionsmuster in der Kontrastmittel-Sonografie (arterielle Hypervaskularisation und Auswaschen in der portalvenösen und venösen Phase) die Diagnose eines HCCs mit einer Sensitivität von 94 % und einer Spezifität von 65 % (bzw. 79 % bei Verwendung standardisierter CEUS-Algorithmen), [8] [14] [15]. Ähnliche Ergebnisse im klinischen Alltag setzen allerdings erfahrene Untersucher voraus. Somit ist es nicht verwunderlich, dass auch der Einsatz der KI zur Charakterisierung fokaler Leberläsionen und zur Diagnose eines HCCs in verschiedenen Studien untersucht wurde. Wie in einer kürzlich veröffentlichten, systematischen Übersichtsarbeit zusammengefasst, erfolgte die KI-gestützte Charakterisierung fokaler Leberläsionen in einem Teil der bislang publizierten Studien nur mithilfe von B-Bild-Daten, teilweise mit CEUS-Daten [16]. Die diagnostische Genauigkeit einer B-Bild-trainierten KI lag zwischen 69 und 98,6 %, bei einer CEUS-trainierten KI lag die diagnostische Genauigkeit zwischen 64 und 98,3 %. Nur ein kleiner Teil der bisher veröffentlichten Studien verglich die Ergebnisse der KI-gestützten Sonografie mit der ärztlichen Beurteilung [16]. In erster Linie weisen die bisherigen Studien jedoch darauf hin, dass eine KI-basierte Klassifizierung mit erfahrenen Untersuchern vergleichbar ist, aber bessere Ergebnisse als unerfahrene Untersucher erzielen kann. Trotz dieser positiven Einschätzung müssen die bisherigen Daten jedoch auch kritisch hinterfragt werden.


#

Limitationen eines klinischen Einsatzes der KI bei der Sonografie des HCCs

Die systematische Beurteilung der wissenschaftlichen Qualität von insgesamt 52 Studien zur Charakterisierung fokaler Leberläsionen in sonografischen Datensätzen mithilfe der QUADAS-2-Kriterien zeigte, dass bei vielen Studien nur eine eingeschränkte Übertragbarkeit der Ergebnisse gegeben ist [16]. In erster Linie liegt das daran, dass in den Arbeiten keine unabhängigen Datensätze zur finalen Testung (sog. Test-Datensatz) des fertig trainierten CNNs verwendet wurden. Zusätzlich wurden in einigen Studien nicht alle typischen Vertreter fokaler Leberläsionen eingeschlossen, wodurch der Einsatz der verwendeten KI-Algorithmen im klinischen Alltag weiter eingeschränkt wird.

Eine bekannte Gefahr beim Training neuronaler Netzwerke ist der „Bias“, also eine Datenverzerrung, z. B. durch den fehlenden Einschluss bestimmter Patientengruppen. In der genannten QUADAS-2-Analyse ließ sich bei vielen Studien keine Aussage zum Risiko durch Bias treffen, da relevante Informationen in der Beschreibung der verwendeten Methodik in einzelnen Arbeiten fehlen [16]. Um ein Bias der KI-Methoden zu überprüfen, wäre grundsätzlich ein Verständnis der zugrunde liegenden Kriterien für die Bild-Klassifizierung nötig. Da eine Überprüfung der Algorithmen der CNNs aufgrund der hohen Komplexität der Systeme in der Regel nicht möglich ist, ist zur Vermeidung eines Bias eine sorgfältige Planung der beim Training eingesetzten Daten unabdingbar. Dies setzt nicht nur eine entsprechende Expertise bei der Durchführung von KI-basierten Studien, sondern auch bei den Gutachtern und Lesern voraus, um die Aussagekraft und Qualität der Arbeiten adäquat einordnen zu können. Für den Einsatz der KI in der Sonografie fassten Kuang et al. verschiedene Aspekte zusammen, die auch KI-unerfahrenen Lesern eine Hilfestellung bei der Bewertung entsprechender Studien geben sollen [17]. Auch hier wurde auf die dringende Notwendigkeit unabhängiger Test-Datensätze (optimalerweise externer Datensätze) hingewiesen. Neben weiteren Punkten sollte darauf geachtet werden, dass die KI-Algorithmen frei zugänglich und damit einsehbar sind, dass die Leistung der KI mit dem Untersuchungsergebnis erfahrener Untersucher verglichen wird, und dass die Ergebnisse mit Daten aus vergleichbaren, publizierten Studien verglichen werden.


#

Schlussfolgerung

Auch wenn der Großteil der bisher veröffentlichten Daten zum Einsatz der KI bei der sonografischen Diagnostik des HCCs auf einer retrospektiven Analyse zuvor erhobener Bilddaten basiert und nicht ohne Weiteres auf eine Echtzeit-Beurteilung der Leber im klinischen Alltag übertragbar ist, sind die bisherigen Daten bereits vielversprechend.

Ähnliche Daten zum Einsatz der KI in der Sonografie gibt es bereits für zahlreiche Anwendungen, allerdings mit ähnlichen Einschränkungen wie bei den hier diskutierten Studien. Eine häufige Problematik stellt die Übertragbarkeit auf die sehr heterogene Situation der klinischen Alltagsdiagnostik dar (u. a. ein möglicher Einfluss unterschiedlicher Geräte, Presets, Schallköpfe, Untersucher etc.). Aufgrund der hohen Zahl möglicher Einflussfaktoren bei der Sonografie sind entsprechend größere Datensätze von verschiedenen Zentren nötig, um der Heterogenität der Bilddaten entgegenzuwirken. Ein gezielter und bzgl. des Mehrwerts kritisch hinterfragter Einsatz der KI, zusammen mit einer sorgfältigen Planung und einer multizentrischen Erhebung von Trainings-, Validierungs- und Testdatensätzen, könnte in Zukunft jedoch – besonders für unerfahrene Untersucher – eine wertvolle Unterstützung darstellen.


#
#
Zoom Image
Prof. Maximilian J Waldner [rerif]
Zoom Image
Prof. Deike Strobel

Conflict of Interest

The authors declare that they have no conflict of interest.

  • References

  • 1 Haug CJ, Drazen JM. Artificial Intelligence and Machine Learning in Clinical Medicine. N Engl J Med 2023; 388 (13) 1201-1208
  • 2 Streim A, Beerlink KP. Drei Viertel sehen Künstliche Intelligenz als Chance. Presseinformation [Web Page] 2023 [cited 2023 11/12/2023]; Available from:. https://www.bitkom.org/Presse/Presseinformation/Drei-Viertel-sehen-Kuenstliche-Intelligenz-Chance
  • 3 Kim M, Yun J, Cho Y. et al. Deep Learning in Medical Imaging. Neurospine 2019; 16 (04) 657-668
  • 4 Koh DM, Papanikolaou N, Bick U. et al. Artificial intelligence and machine learning in cancer imaging. Commun Med (Lond) 2022; 2: 133
  • 5 El Naqa I, Haider MA, Giger ML. et al. Artificial Intelligence: reshaping the practice of radiological sciences in the 21st century. Br J Radiol 2020; 93: 20190855
  • 6 Park SH. Artificial intelligence for ultrasonography: unique opportunities and challenges. Ultrasonography 2021; 40 (01) 3-6
  • 7 Rinella ME, Lazarus JV, Ratziu V. et al. A multisociety Delphi consensus statement on new fatty liver disease nomenclature. Ann Hepatol 2023; 29 (01) 101133
  • 8 Gross S, Bitzer M, Blodt S. et al. Leitlinienreport der S3-Leitlinie Diagnostik und Therapie des Hepatozellulären Karzinoms und biliärer Karzinome – Version 3.0 – Juli 2022, AWMF-Registernummer: 032/053OL. Z Gastroenterol 2023; 61 (04) e157-e171
  • 9 European Association for the Study of the Liver. Electronic address, e.e.e. and L. European Association for the Study of the, EASL Clinical Practice Guidelines: Management of hepatocellular carcinoma. J Hepatol 2018; 69 (01) 182-236
  • 10 Dietrich CF, Teufel A, Sirlin CB. et al. Surveillance of hepatocellular carcinoma by medical imaging. Quant Imaging Med Surg 2019; 9 (11) 1904-1910
  • 11 Tiyarattanachai T, Apiparakoon T, Marukatat S. et al. Development and validation of artificial intelligence to detect and diagnose liver lesions from ultrasound images. PLoS One 2021; 16 (06) e0252882
  • 12 Yang Q, Wei J, Hao X. et al. Improving B-mode ultrasound diagnostic performance for focal liver lesions using deep learning: A multicentre study. EBioMedicine 2020; 56: 102777
  • 13 Strobel D. Using contrast-enhanced ultrasound in the diagnosis of hepatocellular carcinoma – what we have and have not achieved. Ultraschall in Med 2021; 42 (02) 120-124
  • 14 Schellhaas B, Bernatik T, Dirks K. et al. Contrast-Enhanced Ultrasound Patterns for the Non-invasive Diagnosis of Hepatocellular Carcinoma: A Prospective Multicenter Study in Histologically Proven Liver Lesions in a Real-Life Setting Demonstrating the Benefit of Extended Late Phase Observation. Ultrasound Med Biol 2021; 47 (11) 3170-3180
  • 15 Schellhaas B, Bernatik T, Bohle W. et al. Contrast-Enhanced Ultrasound Algorithms (CEUS-LIRADS/ESCULAP) for the Noninvasive Diagnosis of Hepatocellular Carcinoma – A Prospective Multicenter DEGUM Study. Ultraschall in Med 2021; 42 (02) 178-186
  • 16 Vetter M, Waldner MJ, Zundler S. et al. Artificial intelligence for the classification of focal liver lesions in ultrasound – a systematic review. Ultraschall in Med 2023;
  • 17 Kuang M, Hu HT, Li W. et al. Articles That Use Artificial Intelligence for Ultrasound: A Readerʼs Guide. Front Oncol 2021; 11: 631813

Correspondence

Prof. M. Waldner
Medical Clinic 1
Erlangen University Hospital
Ulmenweg 18
91054 Erlangen
Germany   
Phone: +49/0 91 31/8 53 50 00   

Publication History

Article published online:
01 February 2024

© 2024. Thieme. All rights reserved.

Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany

  • References

  • 1 Haug CJ, Drazen JM. Artificial Intelligence and Machine Learning in Clinical Medicine. N Engl J Med 2023; 388 (13) 1201-1208
  • 2 Streim A, Beerlink KP. Drei Viertel sehen Künstliche Intelligenz als Chance. Presseinformation [Web Page] 2023 [cited 2023 11/12/2023]; Available from:. https://www.bitkom.org/Presse/Presseinformation/Drei-Viertel-sehen-Kuenstliche-Intelligenz-Chance
  • 3 Kim M, Yun J, Cho Y. et al. Deep Learning in Medical Imaging. Neurospine 2019; 16 (04) 657-668
  • 4 Koh DM, Papanikolaou N, Bick U. et al. Artificial intelligence and machine learning in cancer imaging. Commun Med (Lond) 2022; 2: 133
  • 5 El Naqa I, Haider MA, Giger ML. et al. Artificial Intelligence: reshaping the practice of radiological sciences in the 21st century. Br J Radiol 2020; 93: 20190855
  • 6 Park SH. Artificial intelligence for ultrasonography: unique opportunities and challenges. Ultrasonography 2021; 40 (01) 3-6
  • 7 Rinella ME, Lazarus JV, Ratziu V. et al. A multisociety Delphi consensus statement on new fatty liver disease nomenclature. Ann Hepatol 2023; 29 (01) 101133
  • 8 Gross S, Bitzer M, Blodt S. et al. Leitlinienreport der S3-Leitlinie Diagnostik und Therapie des Hepatozellulären Karzinoms und biliärer Karzinome – Version 3.0 – Juli 2022, AWMF-Registernummer: 032/053OL. Z Gastroenterol 2023; 61 (04) e157-e171
  • 9 European Association for the Study of the Liver. Electronic address, e.e.e. and L. European Association for the Study of the, EASL Clinical Practice Guidelines: Management of hepatocellular carcinoma. J Hepatol 2018; 69 (01) 182-236
  • 10 Dietrich CF, Teufel A, Sirlin CB. et al. Surveillance of hepatocellular carcinoma by medical imaging. Quant Imaging Med Surg 2019; 9 (11) 1904-1910
  • 11 Tiyarattanachai T, Apiparakoon T, Marukatat S. et al. Development and validation of artificial intelligence to detect and diagnose liver lesions from ultrasound images. PLoS One 2021; 16 (06) e0252882
  • 12 Yang Q, Wei J, Hao X. et al. Improving B-mode ultrasound diagnostic performance for focal liver lesions using deep learning: A multicentre study. EBioMedicine 2020; 56: 102777
  • 13 Strobel D. Using contrast-enhanced ultrasound in the diagnosis of hepatocellular carcinoma – what we have and have not achieved. Ultraschall in Med 2021; 42 (02) 120-124
  • 14 Schellhaas B, Bernatik T, Dirks K. et al. Contrast-Enhanced Ultrasound Patterns for the Non-invasive Diagnosis of Hepatocellular Carcinoma: A Prospective Multicenter Study in Histologically Proven Liver Lesions in a Real-Life Setting Demonstrating the Benefit of Extended Late Phase Observation. Ultrasound Med Biol 2021; 47 (11) 3170-3180
  • 15 Schellhaas B, Bernatik T, Bohle W. et al. Contrast-Enhanced Ultrasound Algorithms (CEUS-LIRADS/ESCULAP) for the Noninvasive Diagnosis of Hepatocellular Carcinoma – A Prospective Multicenter DEGUM Study. Ultraschall in Med 2021; 42 (02) 178-186
  • 16 Vetter M, Waldner MJ, Zundler S. et al. Artificial intelligence for the classification of focal liver lesions in ultrasound – a systematic review. Ultraschall in Med 2023;
  • 17 Kuang M, Hu HT, Li W. et al. Articles That Use Artificial Intelligence for Ultrasound: A Readerʼs Guide. Front Oncol 2021; 11: 631813

Zoom Image
Prof. Maximilian J Waldner [rerif]
Zoom Image
Prof. Deike Strobel
Zoom Image
Prof. Maximilian J Waldner [rerif]
Zoom Image
Prof. Deike Strobel
Zoom Image
Fig. 1 Use of artificial intelligence (AI) in oncological imaging. Previous studies have investigated the possible use of AI in the detection, characterization, and therapeutic monitoring of oncological diseases. Illustration modified according to El Naqa et al., Br J Radiol, 2020 [5].
Zoom Image
Abb. 1 Einsatz der Künstlichen Intelligenz (KI) in der onkologischen Bildgebung. Bisherige Studien untersuchten einen möglichen Einsatz der KI bei der Erkennung (Detection), Charakterisierung (Characterization) und beim therapeutischen Monitoring onkologischer Erkrankungen. Abbildung modifiziert nach El Naqa et al., Br J Radiol, 2020 [5].