Subscribe to RSS
DOI: 10.1055/s-0045-1811099
KI-basierte Prädiktion einer schweren Papillenintubation aus dem endoskopischen Video
Einleitung: Die selektive Intubation des Hauptgallengangs ist entscheidend für eine erfolgreiche ERC, jedoch technisch sehr anspruchsvoll. Eine schwere Papillenintubation erhöht relevant das Risiko einer post-ERCP-Pankreatitis und frustraner Eingriffe. Die ESGE-Leitlinie definiert sie durch>5 Minuten Dauer,>5 Versuche oder>1 unbeabsichtigte Pankreassondierung. Um Komplikationen zu vermeiden sollte bei zu erwartender schwerer Intubation z.B. die Übernahme durch einen erfahrenen Endoskopiker erfolgen. Bisherige Ansätze (klinische Scores, Einzelbild-CNNs) zeigten nur mäßige Prädiktionsleistung und geringe klinische Akzeptanz. Eine KI-Analyse von ERCP-Videos könnte diese Lücke schließen.
Ziele: Ziel dieser Arbeit ist die Entwicklung des ersten Endoskopie-Foundation-Modells, das anhand endoskopischer Videobilder vor Beginn der Kanülierung eine schwere Papillenintubation bei nativer Papille vorhersagt.
Methoden: Wir verwendeten einen etablierten ERCP-Videodatensatz des Uniklinikums Dresden und schlossen 245 ERCPs nativer Papillen ein. Basierend auf den Befunden wurden 133 „leichte“ und 112 „schwere“ Fälle klassifiziert. Zur Datenprozessierung extrahierten wir tiefe visuelle Merkmalsvektoren aus Bildern vor erstem Instrumentenerscheinen mittels DinoV2-L Modell; bei fehlendem Marker wurde der gesamte Merkmalsvektor genutzt. Ein transformerbasiertes MIL-Modell wurde mithilfe des STAMP Tools mit 5-facher Kreuzvalidierung trainiert. Pro Fold erfolgte eine Aufteilung in 147 Trainings-, 49 Validierungs- und 49 Testproben ([Abb. 1] [2]).




Ergebnisse: Eine Auroc von 0,74 wurde erreicht. Das Modell erreichte eine Präzision von 0,71, eine Spezifität von 0,81, einen negativ prädiktiven Wert von 0,66. Die Metriken sind in Bild 1 und Tabelle 1 dargestellt. Eine Optimierung der Prädiktion wird durch Nachannotation basierend auf ESGE-Kriterien und Einsatz eines spezifischen Endoskopie-Foundation-Modells (EndoFM-LV) angestrebt.
Schlussfolgerung: Diese Arbeit präsentiert erstmals ein transformer-basiertes MIL Modell, das schwere Papillenintubation während einer ERCP aus dem rohen Videostream mit moderater Genauigkeit vorhersagt. Die vorläufigen Ergebnisse zeigen das Potenzial KI-assistierter Papillenintubation. Unsere Daten suggerieren, dass Deep-Learning-Modelle einen vielversprechenden Ansatz zur Verbesserung der Intubationsraten und Reduktion von Komplikationen bieten. Weitere Arbeit ist nötig, um die Annotation zu verbessern, das Modell zu verbessern und die klinische Validität zu prüfen.
Publication History
Article published online:
04 September 2025
© 2025. Thieme. All rights reserved.
Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany