Open Access
CC BY-NC-ND 4.0 · Geburtshilfe Frauenheilkd 2024; 84(12): 1118-1125
DOI: 10.1055/a-2335-6122
GebFra Science
Review

Aktuelles aus dem Silicon Valley – wie künstliche Intelligenz die Frauenheilkunde verändert

Article in several languages: English | deutsch
Sebastian Griewing
1   Stanford Center for Biomedical Informatics Research, Stanford University School of Medicine, Palo Alto, CA, USA
2   Institut für Digitale Medizin, Universitätsklinikum Marburg, Philipps-Universität Marburg, Marburg, Germany
3   Klinik für Gynäkologie und Geburtshilfe Marburg, Philipps-Universität Marburg, Marburg, Germany
4   Kommission Digitale Medizin der Deutschen Gesellschaft für Gynäkologie und Geburtshilfe, Berlin, Germany
,
Niklas Gremke
3   Klinik für Gynäkologie und Geburtshilfe Marburg, Philipps-Universität Marburg, Marburg, Germany
,
Uwe Wagner
3   Klinik für Gynäkologie und Geburtshilfe Marburg, Philipps-Universität Marburg, Marburg, Germany
4   Kommission Digitale Medizin der Deutschen Gesellschaft für Gynäkologie und Geburtshilfe, Berlin, Germany
,
Markus Wallwiener
4   Kommission Digitale Medizin der Deutschen Gesellschaft für Gynäkologie und Geburtshilfe, Berlin, Germany
5   Klinik für Gynäkologie und Geburtshilfe Halle, Martin-Luther-Universität Halle-Wittenberg, Halle (Saale), Germany
,
Sebastian Kuhn
2   Institut für Digitale Medizin, Universitätsklinikum Marburg, Philipps-Universität Marburg, Marburg, Germany
,
Commission Digital Medicine of the German Society for Gynecology and Obstetrics› Author Affiliations

 

Zusammenfassung

Künstliche Intelligenz (KI) hat sich zu einem allgegenwärtigen Thema in den Medien entwickelt. Lebhafte Diskussionen halten an, wie KI die globale Gesundheitslandschaft revolutionieren könnte. Die Entwicklung innovativer KI-Modelle wird zunehmend durch große Hightech-Konzerne dominiert, auch im medizinischen Bereich. Das Silicon Valley, als globales Technologieepizentrum, beherbergt viele dieser Tech-Giganten, die mit ihren fortschrittlichen Technologien in die Gesundheitsversorgung drängen. Vom 17. bis 19. Mai 2024 fand dort, in San Francisco, der Jahreskongress des American College of Obstetrics and Gynecology (ACOG) statt. Mit 2 Sessions feierte die ACOG eine KI-Premiere auf dem amerikanischen Fachgesellschaftskongress, in denen aktuelle Themen der KI in der Frauenheilkunde vorstellt werden. Dieser Beitrag bietet einen Überblick über die diskutierten Inhalte und ermöglicht dadurch einen Einblick in die Denkfabrik des Silicon Valley, zeigt auf, wie dort Technologieunternehmen wachsen und scheitern, und beleuchtet, wie unsere amerikanischen Kolleginnen und Kollegen die zunehmende Integration der KI in die gynäkologische und geburtshilfliche Versorgung wahrnehmen. Neben der Einordnung verschiedener aktuell kursierender KI-Begrifflichkeiten stellt der Artikel 3 Anwendungsbereiche von künstlicher Intelligenz in der Frauenheilkunde vor und betrachtet den aktuellen Entwicklungsstand im Kontext bestehender Implementationshürden sowie vor dem Hintergrund des Digitalisierungsstands des deutschen Gesundheitssystems.


Hintergrund

Silicon Valley: Treffpunkt der Tech-Giganten

Silicon Valley, gelegen in der südlichen San Francisco Bay Area an der US-Westküste in Kalifornien, ist weltweit als globales Zentrum für Hightech und Innovation bekannt. Dieses Gebiet hat sich seit der Mitte des letzten Jahrhunderts, beginnend mit der Erforschung und Entwicklung von siliziumbasierten Transistoren, welchen das Valley zudem seinen Namen verdankt, zu einem Hotspot für bahnbrechende technologische Erfindungen entwickelt [1]. Ursprünglich war das heutige Silicon Valley eine landwirtschaftlich geprägte Region, bekannt als das „Valley of Heartʼs Delight“ aufgrund seiner beliebten Obstplantagen. Der Wandel zu einem technologischen Epizentrum begann maßgeblich unter der Leitung von Frederick Terman, dem Dekan der Ingenieurschule der Stanford University. Terman förderte die Gründung eigener Unternehmen durch Dozent*innen und Absolvent*innen der Universität und initiierte 1951 den Stanford Industrial Park, später umbenannt in den Stanford Research Park, wo die Universität Teile ihres Geländes an aufstrebende Technologieunternehmen verpachtete [1]. Zu den geförderten Unternehmen zählten universitäre Ausgründungen wie Hewlett-Packard, Google oder Varian Medical Systems. In den 1980er und 1990er Jahren diversifizierte sich die Forschung und Wirtschaft im Silicon Valley von der Halbleiterfertigung über die Herstellung von Computern bis hin zu Softwareentwicklung und internetbasierten Geschäften [1]. Heute ist die Region Heimat der weltweit führenden Technologieunternehmen, die eine zunehmende Integration von künstlicher Intelligenz (KI) in unseren Alltag vorantreiben, wobei auch die Gesundheitsbranche nicht unberührt bleibt. Wie eng Potenziale und Gefahren bei der Entwicklung moderner Gesundheitstechnologien jedoch beieinanderliegen können, zeigt der Skandal um das ehemalig im Stanford Research Park ansässige Start-up Theranos. Das Unternehmen, das 2015 einen Unternehmenswert von 9 Milliarden US-Dollar erreichte, brach 2018 aufgrund täuschender Versprechen über revolutionäre Diagnosetechnologien, die durch journalistische Recherchen aufgedeckt wurden, rasch zusammen [2]. Ein Beispiel, welches die Bedeutung eines strukturierten und wissenschaftlich fundierten Validierungsprozesses für aufkommende Gesundheitstechnologien unterstreicht.


ACOG Annual Clinical and Scientific Meeting 2024 in San Francisco

In unmittelbarer Nähe zum Silicon Valley, in San Francisco, fand vom 17. bis 19. Mai 2024 der Jahreskongress unserer amerikanischen Schwestergesellschaft (American College of Obstetrics and Gynecology, ACOG) statt, das ACOG Annual Clinical and Scientific Meeting 2024 (ACSM). Die ACSM führt hierbei erstmals mit 2 Sessions die KI als Themenschwerpunkt ein. In den Sessions „Cutting-Edge AI Applications“ und „Generative AI“ werden aktuelle Entwicklungen zur künstlichen Intelligenz in der Frauenheilkunde vorgestellt und in Anwesenheit führender Technologieunternehmen aus dem Valley diskutiert.

Um diese Inhalte auch der Leserschaft der „Geburtshilfe und Frauenheilkunde“ zugänglich zu machen, nimmt diese Übersicht vor dem Hintergrund des Digitalisierungsstands des deutschen Gesundheitssystems eine Einordnung der aktuell kursierenden KI-Begrifflichkeiten vor, stellt 3 auf der ACSM 2024 präsentierte Anwendungsbereiche von KI in der Frauenheilkunde vor und betrachtet den aktuellen Entwicklungsstand im Kontext bestehender Implementationshürden.



Digitalisierungsstand Deutschland und die Kommission Digitale Medizin der Deutschen Gesellschaft für Gynäkologie und Geburtshilfe (DGGG)

In den vergangenen Jahrzehnten hat sich das deutsche Gesundheitssystem nicht als Vorreiter in der Digitalisierung ausgezeichnet. Zu Beginn des Jahres 2023 präsentierte das Bundesministerium für Gesundheit die „Digitalisierungsstrategie für das Gesundheitswesen und die Pflege“, um auf regulatorischer Ebene dem bestehenden Digitalisierungsdefizit entgegenzuwirken [3]. Noch im selben Jahr wurde mit den ersten beiden entsprechenden Gesetzgebungen, dem „Digitalgesetz“ (DigiG) und dem „Gesundheitsdatennutzungsgesetz“ (GDNG), der Grundstein für die umfassenden digitalen Reformplänen des Bundesministeriums für Gesundheit (BMG) gelegt [4], [5]. Auch die DGGG hat im Februar 2022 mit der Gründung der Kommission Digitale Medizin einen weiteren Schritt in Richtung Digitalisierung unternommen, um sich aktiver mit dem Einfluss entsprechender Regulatorik und der rasanten Entwicklung moderner Gesundheitstechnologien im Fachbereich der Gynäkologie und Geburtshilfe auseinanderzusetzen. Dies beinhaltet, unter anderen, auch die aktuellen Entwicklungen und Diskussionen, um das medial mittlerweile omnipräsente Thema der KI für die eigene Fachgesellschaft zugänglich zu machen.


Künstliche Intelligenz und das Versprechen an die Gesundheit

Der Artificial Intelligence (AI) Index Report 2024, herausgegeben von der Human Centered AI Initiative der Stanford University, erfasst, analysiert und visualisiert auf etwa 500 Seiten Daten zu KI aus allen Lebensbereichen [6]. Die wichtigsten Erkenntnisse werden in einer Top Ten zusammengefasst, welche visionäre Schlussfolgerungen formulieren. Unter anderem z. B., dass KI den Menschen bei einigen Aufgaben wie der Bildklassifizierung und Textverständnis bereits übertrifft, während bei komplexeren Herausforderungen, wie beispielsweise der Mathematik oder visuellem Denken, die Technologie weiterhin hinter dem Menschen zurückbleibt. Der Report weist darauf hin, dass die führende Forschung in der KI von der Industrie dominiert wird, von der sich der Großteil der Unternehmen im Silicon Valley befindet. Industriegeführte Forschungs- und Entwicklungsteams entwickelten 2023 insgesamt 51 sogenannte „bemerkenswerte KI-Modelle“, im Vergleich zu nur 15 aus der rein akademischen Gemeinschaft [6]. Denn die Kosten für die Entwicklung führender Modelle, wie das GPT-4 von OpenAI, das geschätzte 78 Millionen Dollar, und das Gemini Ultra von Google, das 191 Millionen Dollar an Rechenleistung kostete, erfordert nicht nur bemerkenswerte finanzielle Ressourcen, sondern vor allem auch entsprechend nachgefragte personelle Ressourcen in Form von top ausgebildeten Entwicklern [6]. Ein Grund, weshalb die Algorithmenentwicklung zunehmend industriegeführt oder in Tandems aus Wissenschaft und Industrie erfolgt.

Der aktuelle Bericht von 2024 beinhaltet in der 7. Auflage erstmals ein neues Kapitel zu „Wissenschaft und Medizin“, in dem die zunehmende Verwendung von KI in der medizinischen Forschung und klinischen Praxis analysiert wird [6]. Aktuelle Zahlen vom 13. Mai 2024 legen offen, dass die US-Food and Drug Administration (FDA) bis zum Jahr 2023 insgesamt 882 KI-basierte Medizinprodukte autorisiert hat [7]. Anhand der Verlaufszahlen zeigt sich eine rasante Entwicklung mit einem Anstieg von ursprünglich 3 von der FDA genehmigten KI-Medizinprodukten im Jahr 2013 auf 171 im Jahr 2023. Doch allein in den ersten 5 Monaten des laufenden Jahres kamen 191 neue Anwendungen hinzu [6].

Betrachtet man die Verteilung der von der FDA zugelassenen KI-basierten Medizinprodukte nach dem jeweiligen medizinischen Fachgebiet, sticht die Radiologie mit aktuell 671 Anwendungen als KI-Spitzenreiter hervor, gefolgt von der kardiovaskulären Medizin mit 89 [7]. Bislang durchlief lediglich ein KI-basiertes Medizinprodukt, welches dem Fachbereich der Gynäkologie und Geburtshilfe zugeordnet wurde, den Zulassungsprozess der FDA. Das KIDScore D3-Tool unterstützt Reproduktionsmediziner mit Prognosen zur Entwicklungswahrscheinlichkeit von Embryonen, basierend auf deren statistischer Lebensfähigkeit [8]. Jedoch befinden sich immer mehr KI-basierte Anwendungen, die der Frauenheilkunde zuzuordnen sind, im FDA-Zulassungsverfahren. Dieses unterscheidet sich grundlegend vom traditionellen FDA-Prozess zur Medikamentenzulassung und verändert sich weiterhin parallel zur rasanten technologischen Entwicklung.


Künstliche Intelligenz in der Frauenheilkunde

Die KI-Sessions des ACOG Annual Clinical and Scientific Meeting 2024 (ACSM) starten mit einer Einordnung einiger in der Presse aktuell kursierender KI-Begrifflichkeiten ([Abb. 1]): Während künstliche Intelligenz (KI) das Konzept beinhaltet, dass Maschinen/Algorithmen solche Aufgaben ausführen, die normalerweise menschliche Intelligenz erfordern, so beschreibt Machine Learning (ML) diejenigen Algorithmen, die aus Mustern und Beziehungen in Daten lernen, ohne auf diese zuvor explizit programmiert zu werden. ML gliedert sich in 3 Haupttypen: Supervised Learning beinhaltet, dass der Algorithmus von zuvor aufbereiteten und gekennzeichneten Trainingsdaten lernt, Unsupervised Learning, dass der Algorithmus aus unmarkierten und -strukturierten Trainingsdaten lernt und eigenständig Beziehungen in den Daten entdeckt, sowie Reinforcement Learning, welches Modelle einbezieht, die durch Interaktion mit der Umwelt und aus den damit verbundenen Belohnungen lernen, um dadurch Entscheidungen treffen zu können. Deep Learning ist wiederum Teilbereich des maschinellen Lernens, der auf tiefen neuronalen Netzen basiert, die dem menschlichen Gehirn nachempfunden aus vielen hintereinander geschalteten Schichten bestehen, und es ermöglicht, komplexe Muster und Zusammenhänge in großen und oft unstrukturierten Datenmengen durch hierarchisches Lernen und automatische Merkmalsextraktion zu erkennen und zu modellieren. Die aktuell in den Medien sehr präsente generative KI schließt entsprechende Deep-Learning-Modelle ein, die zusätzlich Texte, Audio oder Video aber auch z. B. synthetische Daten generieren können.

Zoom
Abb. 1 Übersicht der KI-Begrifflichkeiten.

Im Anschluss an diese Einführung werden verschiedene Anwendungsbereiche der KI in der gynäkologischen und geburtshilflichen Medizin vorgestellt:

KI in der fetalen Herzfrequenzüberwachung

Zunächst wird auf die Verwendung von KI zur fetalen Herzfrequenzüberwachungen (FHF) eingegangen. Trotz der Etablierung von Standards der CTG-Auswertung, wie beispielsweise den FIGO-Kriterien, bleiben die Bewertungen oft uneinheitlich und subjektiv. Hohe Intra- und Inter-Beobachter-Variabilität sowie Unsicherheiten bei der Identifikation kritischer Zustände führen dazu, dass Risiken für Mutter und Kind manchmal nicht rechtzeitig erkannt und behandelt werden [9]. Erste intelligente Algorithmen unterstützen die Beschreibung der FHF, ermöglichen aber bisher keine konkrete prädiktive Vorhersage zur frühen Erkennung fetaler Gefährdungen. Der in 2017 erstpublizierte INFANT Trial, der 46 000 Patientinnen in 24 Zentren umfasste, formuliert als Kernaussage, dass die computergestützte Auswertung von CTGs bei Frauen mit kontinuierlicher elektronischer Überwachung des Fetus während der Wehen nicht zu einer Verbesserung der klinischen Ergebnisse für Mütter oder Säuglinge führt [10]. Dementgegen steht harsche Kritik am INFANT-Studiendesign, einschließlich unschlüssiger Randomisierung und Verblindung oder unzureichende Erfassung entscheidender klinischer Daten, die im Alltag als wichtige klinische Entscheidungsgrundlage dienen.

OʼSullivan et al. fassen die Lehren aus dem INFANT-Trial in einem Review-Artikel zusammen und formulieren die Herausforderungen bei der Entwicklung robuster KI-Modelle für die intrapartale FHF-Überwachung [11]. Auch die KI-Modelle benötigen eine Orientierung in der Unterscheidung zwischen pathologisch und physiologisch, aber da dies, meist nicht „Schwarz oder Weiß“ ist, bleibt „nicht beruhigend“ weiterhin ein Spektrum und macht es den ML-Algorithmen schwierig, die Muster in den Daten zu erkennen. Zudem sind umfassende Datensätze selten, sie bieten jedoch die Grundlage der Entwicklung eines jeden KI-Algorithmus. Die meisten Trainingsdaten enthalten keine klinischen Daten aus der anschließenden neonatologischen Betreuung oder Informationen über die Langzeitergebnisse der Neugeborenen. Damit beschränken aktuelle Trainingsdaten die Modellentwicklung auf die Kernelemente des Nabelschnur-pHs, Base Excess, Laktat und Apgar [12]. Die Autoren fordern eine genauere Falldefinition und Segmentierung der Daten, in Verbindung mit der Einbeziehung weiterer klinischer Variablen und Datenmodalitäten, welche die Entwicklung eines erklärungsfähigen Tools zur Entscheidungsunterstützung perspektivisch ermöglichen kann.

Dass die Kombination von KI und FHF-Überwachung jedoch gelingen kann, zeigt eine vorgestellte Studie von Chiou et al. [9]. Diese untersucht die automatisierte CTG-Interpretation als mögliche Lösung zur Verbesserung der Früherkennung von fetaler Hypoxie während der Wehen, um somit unnötige operative Eingriffe zu reduzieren und die Gesamtversorgung von Müttern und Neugeborenen zu verbessern. In dieser Studie wird Deep Learning eingesetzt, um die mit der visuellen CTG-Interpretation verbundene Subjektivität zu verringern. Die Ergebnisse zeigen die Durchführbarkeit des Einsatzes von Deep Learning zur Vorhersage von fetaler Hypoxie anhand von CTG-Aufzeichnungen. Es wird jedoch ebenso darauf hingewiesen, dass, um die Robustheit der Ergebnisse zu verbessern, künftige Untersuchungen einen größeren und vielfältigeren Datensatz aus Entbindungszentren auf der ganzen Welt umfassen sollten, der unterschiedliche klinische Kontexte, demografische Merkmale und Ergebnisse beinhalten sollte [13].

Die Vorstellung des Anwendungsbereichs endet mit der Aussage, dass KI in der FHF-Überwachung bereits angekommen ist. Zukünftige Verbesserung der Modelle basierend auf umfassenderen Trainingsdaten wird zur zeitnahen klinischen Validierung und zu der Medizinproduktzulassung entsprechender Algorithmen führen, wenn vielleicht auch erst auf dem amerikanischen Markt. Ersetzen werden die Modelle die Behandler*innen jedoch nicht, denn bei einem Punkt sind sich die amerikanischen Kolleg*innen einig: Die Entscheidung zur klinischen Intervention obliegt weiterhin dem Team aus Hebamme und Ärzt*in.


KI im Ultraschall

Auch bei der Vorstellung des 2. Anwendungsbereichs verweilen die Kolleg*innen thematisch zunächst in der Geburtshilfe. Während uns die Objektivierung der FHF oftmals vor eine Herausforderung stellt, so bietet der geburtshilfliche Ultraschall oft greifbarere Standards und somit zahlreiche Anwendungsfelder für die Entwicklung von robusten KI-Modellen. Zu den KI-sensiblen Aufgaben im Ultraschall gehören die Klassifikation (Was ist dieses Objekt?), Segmentierung (Wo befindet sich der Umriss des Kopfes?), Navigation (Wie erhält man das optimale Bild?), Qualitätsbeurteilung (Ist dieses Bild brauchbar?), Diagnose (Was ist die Diagnose dieses Bildes?) und die Erstellung von Berichten (Bitte verfasse einen Ultraschallbericht). Ein Review von Chen et al. fasst zusammen, wie die Kombination von KI und Ultraschall die Kliniker bei der Diagnose vielfältiger Zustände und Krankheiten unterstützt [14]. Die Autoren zeigen auf, wie die Kombination die Effizienz steigern kann, die Anzahl der Fehldiagnosen reduzieren, die Qualität der medizinischen Leistungen verbessern und letztlich den Patient*innen zugutekommt. Im geburtshilflichen Ultraschall wird KI zur Strukturerkennung, beispielsweise der abdominalen Organe und Gesichtsstrukturen, sowie zur Berechnung des Ventrikelvolumens und der Dicke der Ventrikelwand in der fetalen Echokardiografie eingesetzt. Weitere Anwendungen umfassen die automatische Messung der Nackentransparenz oder des Volumens fetaler Strukturen, wie Kopf, Blase oder Magen, sowie die Klassifikation und Diagnose von Frühgeburtenrisiken mittels Zervixultraschall, die Beurteilung der fetalen Lungenreife, angeborener Herzerkrankungen oder der Quantifizierung des fetalen Gewichts und Gestationsalters. Jost et al. zeigen in ihrem systematischen Literaturüberblick, dass die Geburtshilfe im Fachbereichsvergleich aktuell die dominierende Disziplin für KI im frauenheilkundlichen Ultraschall ist, obwohl sich auch in der Gynäkologie zahlreiche Anwendungen finden lassen, beispielsweise bei der Identifizierung von Adnex- und Brusttumoren sowie der Beurteilung der Gebärmutterschleimhaut und des Beckenbodens [15].

Die zentrale Aussage der Session ist, dass KI-gesteuerter Ultraschall bereits Realität ist, meistens ungeachtet unseres Bewusstseins, durch nahtlose Integration in das Ultraschallgerät. Die Vorteile von KI-unterstütztem Ultraschall liegen nach Ansicht der Kolleg*innen vor allem in der Effizienzsteigerung, beispielsweise durch schnellere Aufnahme und Auswertung von Bildern sowie automatische Messungen. Weitere Vorteile sind die Verbesserung der Ergebnisse durch konsistente Bewertungen, höhere Genauigkeit und die Verringerung von Messfehlern durch Standardisierung sowie die Unterstützung des medizinischen Personals durch Schulungen, Wissensassistenz und prozessuale Entlastung. Aber auch die Implementationshürden werden genannt, und diese lassen an die FHF-Überwachung denken: Daten sind entscheidend. Die Entwicklung wird durch limitierte, qualitativ hochwertige Datensätze mit inhärenten Verzerrungen eingeschränkt, zudem bestehen Bedenken hinsichtlich des Datenschutzes und der Datensicherheit. Die Leistung der Algorithmen bleibt eine Herausforderung, da die komplexen Modelle in Echtzeit funktionieren müssen und die Erklärbarkeit und Transparenz für den klinischen Anwender oft unzureichend ist. Abschließend wird daran appelliert, dass weiter in die technologische Akzeptanz investiert werden müsse. Die klinische Validierung ist bisher noch lückenhaft, regulatorische Hürden bestehen und die Frage der Haftung bleibt bestehen, bevor die umfassende klinische Adoption gelingen kann [16].


KI in der robotischen Chirurgie

In der Vorstellung des 3. Anwendungsbereichs führen die Kolleg*innen eine weitere Begrifflichkeit ein: Surgical Data Science (SDS). SDS ist ein interdisziplinäres Feld, das Methoden der Datenwissenschaft und Informatik nutzt, um chirurgische Verfahren und Ergebnisse zu verbessern. Es umfasst die Sammlung, Analyse und Interpretation von Daten aus verschiedenen Quellen oder Modalitäten, einschließlich Bildgebung, Patientenakten, intraoperativen Sensoren und anderen medizinischen Geräten [17]. SDS zielt darauf ab, die chirurgische Planung und Vorbereitung zu verbessern, indem präzisere und individuellere Operationspläne erstellt werden. Während der Operation unterstützt SDS die Chirurgen durch Echtzeitanalysen, die wichtige Informationen liefern und potenzielle Probleme frühzeitig erkennen. Postoperative Überwachung und Nachsorge werden durch die Analyse von Daten optimiert, um Komplikationen frühzeitig zu erkennen. Darüber hinaus trägt SDS zur Verbesserung der chirurgischen Ausbildung bei, indem sie virtuelle Realität und Simulationen auf Basis realer Daten nutzt. Schließlich unterstützt SDS die klinische Forschung durch die Analyse großer Datenmengen, um neue Erkenntnisse über chirurgische Praktiken und Patientenergebnisse zu gewinnen. Damit ist SDS eng verzahnt mit der Robotikchirurgie, welche die strukturierte Erfassung der objektiven und granularen Parameter der chirurgischen Leistung, z. B. die exakte Aufnahme der Druckausübung oder Länge der Koagulationsphasen, ermöglicht. Durch diese zunehmende Datenerfassung in Kombination mit der Datenprozessierung durch KI kann SDS dazu beitragen, erweiterte und automatisierte Coaching-, Feedback-, Bewertungs- und Entscheidungshilfen in der Chirurgie zu ermöglichen [18].

Ein bekanntes Muster lässt sich erkennen: Wenn ein großes, diverses und multimodales Datenset verfügbar ist, welches aufgrund der Vielzahl an verschiedenen Variablen vom Menschen nicht eigenständig verarbeitet werden kann, unterstützt die künstliche Intelligenz dabei, wertvolle Datenschätze zu heben, von denen man zuvor nicht wusste, wo genau sie liegen. Und aus diesen Schätzen kann wiederum gelernt werden oder gar die KI dazu genutzt werden, basierend auf den erlernten Beziehungen innerhalb der Daten die Behandelnden in ihrer chirurgischen Tätigkeit zu unterstützen. Klar wird im Rahmen der Vorstellung des 3. Anwendungsbereichs, dass die KI auch schon den Weg in die chirurgische Domäne gefunden hat, wenn auch zunächst nur in Bereichen, die strukturierte Datenerfassung erlauben und damit vorwiegend die Robotikchirurgie [17]. Bedenkt man nun, dass der OP-Roboter noch nicht zur Standardausstattung gehört und, wenn er vorhanden ist, dann vielleicht durch die Kolleg*innen der Urologie für die roboterassistierte Prostatektomie blockiert ist, so bleibt abzuwarten, wann SDS und KI alltägliche Begleiter in der Gynäkologie und Geburtshilfe werden.


Generative KI

In der 2. Session wird sich ausschließlich einem einzelnen Subbereich der KI gewidmet: der generativen KI. Seit der offiziellen Markteinführung des großen Sprachmodells (Large Language Model, LLM) ChatGPT von der Firma OpenAI mit Hauptsitz in San Francisco erfuhr die generative KI eine Explosion an medialer Aufmerksamkeit. Solche sogenannten „Foundation Models“ nutzen große Mengen an Daten, die durch Reinforcement Learning und Supervised Learning mit menschlichem Feedback trainiert werden, um Text, Daten, Sprache und andere strukturierte Daten zu verarbeiten und vielfältige Aufgaben zu erfüllen. Dazu gehören Informationsextraktion, Bildbeschreibung, Objekterkennung, Analyse von psychischen Stimmungen und die Beantwortung vielfältigster Fragen. Früher war es in der KI notwendig, ein spezifisches Modell für eine spezifische Aufgabe zu entwickeln, aber heute kann ein entsprechendes Foundation Model eine Vielzahl von Aufgaben gleichzeitig übernehmen. Dabei nutzen LLMs mathematische Modelle, um beispielsweise in ihrer Textformulierung das nächstwahrscheinlichste Wort zu errechnen. Kiela et al. zeigen, in welcher Geschwindigkeit diese KI-Systeme den Menschen in den vergangenen Jahren in der Sprach- und Bilderkennung übertroffen haben und dass der Durchbruch in den vergangenen 3 – 4 Jahren gelang [19]. Nori et al. erweitern diese Ergebnisse auf die Medizin und zeigen, wie spezialisierte Medizin-LLMs rapide an Leistungsfähigkeit zulegen [20]. Die Session fasst den aktuellen Stand zur generativen KI unter dem Titel „The Good, the Bad and the Ugly“ zusammen, ohne hierbei auf konkreten Anwendungsfälle der Gynäkologie und Geburtshilfe einzugehen ([Abb. 2]).

Zoom
Abb. 2 Übersicht zu The Good, the Bad and the Ugly der generativen KI (Abb. basiert auf Daten aus: Zusammenfassung der Session „Generative AI“ der ACSM 2024).

Generative KI kann schon heute in vielen relevanten Bereichen der Medizin Vorteile bieten, von der klinischen Versorgung durch Erleichterung der Administration und Unterstützung von Versorger*innen und Patient*innen bis hin zur medizinischen Lehre und Forschung sowie Public Health. Andererseits zeigt „The Bad“, dass viele Fragen im Umgang mit generativer KI weiterhin ungelöst sind, u. a. hinsichtlich der Sicherung des Datenschutzes, der Entscheidungstransparenz für die Nutzer sowie den ethischen und legislativen Grundlagen. Somit ist weiterhin unklar, wie mit geistigem Eigentum, Haftung und Urheberrechten im Hinblick auf generative KI umgegangen wird oder wer Zugang zu welchen Modellen hat. Auch die Analyse der Auswirkungen der klinischen Adoption der Modelle bleibt weitestgehend unbeantwortet. In welchen Bereichen können wir mit einem Rückgang von menschlichen Fähigkeiten und der Umgehung von bisher unumgänglichen Lernprozessen in der medizinischen Ausbildung rechnen, und führt die Implementierung von KI zu einer „Entmenschlichung“ in einigen Bereichen? „The Ugly“ zeigt, wie gefährlich die Schwächen von generativer KI sein können: Sogenannte Hallucinations (Halluzinationen), wenn Modelle der generativen KI Informationen erfinden, um auf „Biegen und Brechen“ eine Antwort zu geben, oder sogenannte Omissions (Unterlassungen), wenn das Modell keine vollständige Antwort gibt und wichtige Informationen unterschlägt. Eine Publikation von Alkaissi et al. untersuchte die Fähigkeit von ChatGPT, die Pathogenese verschiedener Erkrankungen zu beschreiben, und konnte zeigen, dass der Chatbot teilweise nichtexistierende pathogene Verbindungen halluzinierte oder auch Quellen erfand, die es gar nicht gab [21]. Zudem zeigen die LLMs eine Tendenz zu Vorurteilen und Diskriminierung, an der wir als Forscher teilweise sogar nicht ganz unschuldig sind. Dies liegt daran, dass die Modelle auf existierenden Datenbanken trainiert sind, die teils bedeutende ethnische und geschlechtsspezifische Voreingenommenheit aufweisen. Zack et al. konnten zeigen, dass GPT-4 die demografische Vielfalt von Krankheiten nicht angemessen modelliert und durchweg klinische Vignetten produziert, die demografische Präsentationen stereotypisieren [22]. Sie betonen die dringende Notwendigkeit einer umfassenden und transparenten Bewertung der Verzerrungen von Instrumenten der generativen KI für die vorgesehenen Anwendungsfälle, bevor sie in die klinische Versorgung integriert werden. Zudem weisen die öffentlich zugänglichen Modelle bisher keine ausreichende Qualität und Sicherheit auf, um den sicheren Umgang mit sensiblen Patient*innendaten zu gewährleisten. Die Modelle kämpfen mit Leistungsproblemen hinsichtlich Genauigkeit und fehlendem wissensbasierten Denken und Argumentieren, wodurch Fehlinformationen entstehen können. Diese münden teilweise in sogenannten „Deep Fakes“ und sind aufgrund der hohen visuellen und textuellen Fähigkeiten der Modelle dann für das menschliche Auge oft schwer zu erkennen. Eindämmungsstrategien wie das Trustworthy & Responsible AI Network (TRAIN) [23], die Coalition for Health AI [24] und der AI Act der Europäischen Union [25] stellen wichtige Schritte in der Definition der Grundregeln und Grenzen im Umgang mit der KI dar.

Die Session endet mit dem Hinweis an das Auditorium, dass generative KI ein zunehmend leistungsfähigeres Werkzeug wird, welches von Patient*innen, medizinischen Fachkräften und Familienangehörigen genutzt wird. Für uns als Fachexpert*innen der Gynäkologie und Geburtshilfe sollte dies bedeuten, die historische Chance nicht zu verpassen, sich mit diesen Anwendungen auseinanderzusetzen, sie kritisch zu bewerten und sich darüber hinaus aktiv an ihrer Integration in unser Fachgebiet zu beteiligen.



Fazit und Ausblick: künstliche Intelligenz und Frauenheilkunde, quo vaditis?

Zusammenfassend lassen sich die im Silicon Valley und an der ACSM gewonnenen Eindrücke in 3 wesentliche Punkte verdichten, die erklären, warum KI in das Fachgebiet der Gynäkologie und Geburtshilfe Einzug halten wird und wie sie bereits heute oder in naher Zukunft die klinische Praxis in der Frauenheilkunde verändern kann:

Die Daten

„Data is the new oil“ – eine Metapher, die vom Mathematiker Clive Humby im Jahr 2006 geprägt wurde und heute aktueller denn je erscheint. Auch in der Frauenheilkunde gibt es diese „Big Data“. In der gynäkologischen Onkologie etwa führt eine zunehmende Datenflut durch Fortschritte in der Präzisionsonkologie, verbessertem genomischen Profiling und zielgerichteten Therapien zu erheblichen Verbesserungen in der Diagnose und Behandlung, was zu bedeutenden Durchbrüchen geführt hat [26]. Mit diesen Fortschritten geht eine Fülle an multimodalen Behandlungs- und Diagnosedaten sowie zunehmend komplexere Forschungsergebnisse einher, die nach und nach die Grenzen der menschlichen kognitiven Verarbeitung überschreiten. KI hilft hier schon heute, die menschliche medizinische Intelligenz zu erweitern, um diese großen Mengen an Daten und Textinformationen erfolgreich zu verarbeiten [27], [28]. Und trotzdem: Während an manchen Stellen Daten im Überfluss vorhanden sind, zeigt sich beispielsweise bei der fetalen Herzfrequenzüberwachung, dass KI zwar Potenzial beweist, jedoch nicht die Menge an qualitativ hochwertigen Trainingsdaten mit entsprechender Diversität zur Verfügung steht, die zur Entwicklung robuster Modelle notwendig wäre.


Die visuelle Komponente

Die rasante Entwicklung von FDA-zugelassenen KI-Medizinprodukten in der Radiologie zeigt: KI beweist aktuell bereits ein besonderes Talent in der Verarbeitung von visuellen Elementen [6]. Und auch in der Frauenheilkunde gibt es diese: Von der Mammografie und der Histopathologie, über die Kolposkopie und Laparoskopie bis hin zum spezialisierten Pränatalultraschall lernt die KI, verschiedene visuelle Komponenten der frauenheilkundlichen Diagnostik zu verarbeiten. Obwohl die Leistungsfähigkeit je nach Anwendungsfall noch deutlich variieren kann, bilden diese Bereiche eine der ersten Brücken, über die sich die Technologie in unserem Fachbereich integrieren wird.


Die Patientin

Zudem darf bei der Diskussion über KI in der geburtshilflichen und gynäkologischen Diagnostik und Therapie der Blick auf die Patientenklientel nicht fehlen. Das durchschnittliche Alter der Erstgebärenden in Deutschland liegt bei 31,7 Jahren, und auch in der Gynäkologie wird das gesamte Altersspektrum, einschließlich einer nicht zu vernachlässigenden Anzahl jüngerer, digital affiner Patientinnen behandelt [29]. Eine Besonderheit, die dazu beiträgt, dass aufkommende Technologien gleichzeitig schneller an Relevanz in der klinischen Behandlungsrealität gewinnen.

Die Übersicht der beiden KI-Sessions der ACSM 2024 zeigt, dass die Anwendungsmöglichkeiten der künstlichen Intelligenz (KI) breit gefächert und so umfangreich sind, dass sie sich nicht allumfassend in einer kurzen Übersichtsarbeit zusammenfassen lassen. Die zunehmende Anwendung der KI in der klinischen Versorgung bedarf der wissenschaftlichen Begleitung, auch in der Frauenheilkunde. Sei es durch wissenschaftliche Originalarbeiten oder durch Evidenzsynthese mittels strukturierter Literaturreviews und Metaanalysen – bei einer derart rapiden technologischen Entwicklung ist dies nur im interdisziplinären globalen Netzwerk möglich. Die Kommission Digitale Medizin der DGGG hat sich hierzu national positioniert und wird auch zukünftig durch Ausweitung ihrer Tätigkeiten daran arbeiten, aktuelle Themen für die eigene Fachgesellschaft zugänglich zu machen und Potenziale für die gynäkologische und geburtshilfliche Versorgung zu nutzen.




Conflict of Interest/Interessenkonflikt

The authors declare that they have no conflict of interest./Die Autorinnen/Autoren geben an, dass kein Interessenkonflikt besteht.


Correspondence/Korrespondenzadresse

Sebastian Griewing
Stanford Center for Biomedical Informatics Research
Stanford University School of Medicine
3180 Porter Driver
Palo Alto
California, USA   

Publication History

Received: 31 May 2024

Accepted after revision: 01 September 2024

Article published online:
06 December 2024

© 2024. The Author(s). This is an open access article published by Thieme under the terms of the Creative Commons Attribution-NonDerivative-NonCommercial License, permitting copying and reproduction so long as the original work is given appropriate credit. Contents may not be used for commecial purposes, or adapted, remixed, transformed or built upon. (https://creativecommons.org/licenses/by-nc-nd/4.0/)

Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany


Zoom
Fig. 1 Overview of AI terminology.
Zoom
Fig. 2 Overview of The Good, the Bad and the Ugly of Generative AI (Fig. is based on data from: summary of the session “Generative AI” of the 2024 ACSM).
Zoom
Abb. 1 Übersicht der KI-Begrifflichkeiten.
Zoom
Abb. 2 Übersicht zu The Good, the Bad and the Ugly der generativen KI (Abb. basiert auf Daten aus: Zusammenfassung der Session „Generative AI“ der ACSM 2024).