Z Gastroenterol 2025; 63(08): e608-e609
DOI: 10.1055/s-0045-1811084
Abstracts | DGVS/DGAV
Kurzvorträge
KI in der Endoskopie-Bildverarbeitung & Diagnostik Donnerstag, 18. September 2025, 10:55 – 11:51, Seminarraum 14 + 15

Edge-KI in der Kapselendoskopie: Lokalisierung und Anomalieerkennung auf dem Galar-Datensatz

Authors

  • M Le Floch

    1   Universitätsklinikum Dresden, Medizinische Klinik 1, Dresden, Deutschland
    2   Else Kröner Fresenius Zentrum für Digitale Gesundheit, Technische Universität, Dresden, Deutschland
  • J Werner

    3   Universität Tübingen, Fachbereich Informatik, Tübingen, Deutschland
  • J L Steinhäuser

    1   Universitätsklinikum Dresden, Medizinische Klinik 1, Dresden, Deutschland
    2   Else Kröner Fresenius Zentrum für Digitale Gesundheit, Technische Universität, Dresden, Deutschland
  • H Tolle

    1   Universitätsklinikum Dresden, Medizinische Klinik 1, Dresden, Deutschland
    2   Else Kröner Fresenius Zentrum für Digitale Gesundheit, Technische Universität, Dresden, Deutschland
  • C Stopp

    1   Universitätsklinikum Dresden, Medizinische Klinik 1, Dresden, Deutschland
  • S Sulk

    1   Universitätsklinikum Dresden, Medizinische Klinik 1, Dresden, Deutschland
  • J Hampe

    1   Universitätsklinikum Dresden, Medizinische Klinik 1, Dresden, Deutschland
    2   Else Kröner Fresenius Zentrum für Digitale Gesundheit, Technische Universität, Dresden, Deutschland
  • O Bringmann

    3   Universität Tübingen, Fachbereich Informatik, Tübingen, Deutschland
  • F Brinkmann

    1   Universitätsklinikum Dresden, Medizinische Klinik 1, Dresden, Deutschland
    2   Else Kröner Fresenius Zentrum für Digitale Gesundheit, Technische Universität, Dresden, Deutschland
 
 

Einleitung: Die Kapselendoskopie erlaubt eine minimalinvasive Bildgebung des Dünndarms. Aufgrund begrenzter Rechen- und Batterieleistung in der Kapsel sind klassische KI-Verfahren bislang nur retrospektiv nutzbar. Eine intelligente Vorverarbeitung direkt in der Kapsel („Edge-KI“) k önnte daher den klinischen Nutzen deutlich steigern.

Ziele: Ziel dieser Arbeit ist die Entwicklung und Bewertung eines energieeffizienten KI-Ansatzes zur gleichzeitigen Lokalisation der Kapsel im Gastrointestinaltrakt und Detektion pathologischer Befunde. Der Fokus liegt auf ressourcenschonender und effizienten Bildanalyse in Echtzeit zur Integration in zukünftige Kapselgenerationen. Dies wird erstmals am Dresdner Galar-Datensatz demonstriert, der im Vergleich zu bisherigen Kapselendoskopie-Datensätzen eine breitere und detailliertere Annotation bietet.

Methodik: Grundlage bildet der Galar-Datensatz mit über 3,5 Millionen Bildern aus 80 vollständigen Kapseluntersuchungen. Für die Anomalieerkennung wurden verschiedene KI-basierte Strategien entwickelt, darunter Autoencoder, semi-supervised Klassifikation und Ensemble-Modelle [3]. Zur Organdetektion wurde auf Basis von [2] ein leichtgewichtiges CNN mit einem Hidden-Markov-Modell (HMM) kombiniert. Zusätzlich wurde ein kompaktes Multi-Task-Modell (MTL) auf dem Galar-Datensatz trainiert, das beide Aufgaben simultan löst [4].

Ergebnis: Das CNN-HMM-Modell erreichte eine Lokalisationsgenauigkeit von 92 % [4] bei minimalem Rechenaufwand (< 1 Mio. Parameter). Die Anomaliedetektion erzielte AUC-Werte von bis zu 77 % [3]. Der Multi-Task-Ansatz ermöglichte eine weitere Reduktion der Modellgröße ohne Leistungseinbußen. Alle Methoden erlauben eine kontextbasierte Bewertung einzelner Bilder mit anatomischer Einordnung ([Abb. 1] [2]).

Zoom
Abb. 1 Verteilung der Annotationen im Galar-Datensatz über technische, anatomische und pathologische Kategorien. Die Grafik zeigt die Häufigkeit der vergebenen Labels [1].
Zoom
Abb. 2 Übersicht des entwickelten Workflows. Der Galar-Datensatz bildet die Grundlage für die Entwicklung energieeffizienter Modelle zur Lokalisation und Anomaliedetektion. Beide Pfade werden in einem kompakten Multi-Task-Modell vereint und für die Anwendung in Edge-KI-Systemen der Kapselendoskopie optimiert. Modelle zur Anomaliedetektion und Lokalisation entwickelt in Zusammenarbeit mit der Universität Tübingen, Lehrstuhl für Eingebettete Systeme [2] [3] [4].

Schlussfolgerung: Die Kombination aus Galar-Daten, HMM-gestützter Lokalisation und robusten Detektionsmodellen ermöglicht einen praxisnahen Edge-KI-Ansatz für die Kapselendoskopie. Sie bildet die Grundlage für eine autonome, ressourcenschonende Bildanalyse direkt in der Kapsel. Freigewordene Batteriekapazität kann z. B. für höherauflösende Kameras oder längere Aufnahmezeiten genutzt werden. Der Ansatz stellt einen ersten Schritt hin zu einer intelligenten Kapsel dar, die in zukünftigen Generationen erweiterte diagnostische und therapeutische Funktionen ermöglichen könnte ([Table 1]).

Tab. 1 Überblick über getestete Methoden zur Anomaliedetektion im Dünndarm.

Methode

AUC [%]

Parameteranzahl

Baseline (Einzelklassifikation)

ca. 61

25 Mio.

Bildklassifikator

74,94

1 Mio.

Ensemble: SVM, Autoencoder, Klassifikator

76,98

4 Mio.

Verglichen werden ein konventioneller Baseline-Ansatz mit Einzelklassifikation, ein kompakter Bildklassifikator sowie ein Ensemble-Modell, das auf der Kombination von Autoencoder, Bildklassifikation und SVM basiert. Das Ensemble erzielt die höchste AUC bei gleichzeitig moderater Modellgröße – ein vielversprechender Ansatz für robuste Edge-KI-Systeme unter Hardware-Limitierungen [3].


  • Literatur

  • 1 Galar – a large multi-label video capsule endoscopy dataset”. Le Floch, Maxime; Wolf, Fabian; McIntyre, Lucian; et al. Figshare+ 2025
  • 2 „Precise Localization Within the GI Tract by Combining Classification of CNNs and Time-Series Analysis of HMMs.” Werner, J., Gerum, C., Reiber, M., Nick, J., Bringmann, O 2024. In: Cao, X., Xu, X., Rekik, I., Cui, Z., Ouyang, X. (eds) Machine Learning in Medical Imaging. MLMI 2023. Lecture Notes in Computer Science. vol 14349. Springer; Cham:
  • 3 Werner J., Gerum C., Nick J., Floch M.L., Brinkmann F., Hampe J., Bringmann O.. 2025 Enhanced Anomaly Detection for Capsule Endoscopy Using Ensemble Learning Strategies. arXiv preprint arXiv. 2504.06039, Accepted at EMBC.
  • 4 &quot;Advancing Video Capsule Endoscopy: A Multi-Task Learning Approach&quot;, by Julia Werner, Oliver Bause, Maxime Le Floch, Franz Brinkmann, Jochen Hampe, Oliver Bringmann. Preprint 2025.

Publication History

Article published online:
04 September 2025

© 2025. Thieme. All rights reserved.

Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany

  • Literatur

  • 1 Galar – a large multi-label video capsule endoscopy dataset”. Le Floch, Maxime; Wolf, Fabian; McIntyre, Lucian; et al. Figshare+ 2025
  • 2 „Precise Localization Within the GI Tract by Combining Classification of CNNs and Time-Series Analysis of HMMs.” Werner, J., Gerum, C., Reiber, M., Nick, J., Bringmann, O 2024. In: Cao, X., Xu, X., Rekik, I., Cui, Z., Ouyang, X. (eds) Machine Learning in Medical Imaging. MLMI 2023. Lecture Notes in Computer Science. vol 14349. Springer; Cham:
  • 3 Werner J., Gerum C., Nick J., Floch M.L., Brinkmann F., Hampe J., Bringmann O.. 2025 Enhanced Anomaly Detection for Capsule Endoscopy Using Ensemble Learning Strategies. arXiv preprint arXiv. 2504.06039, Accepted at EMBC.
  • 4 &quot;Advancing Video Capsule Endoscopy: A Multi-Task Learning Approach&quot;, by Julia Werner, Oliver Bause, Maxime Le Floch, Franz Brinkmann, Jochen Hampe, Oliver Bringmann. Preprint 2025.

 
Zoom
Abb. 1 Verteilung der Annotationen im Galar-Datensatz über technische, anatomische und pathologische Kategorien. Die Grafik zeigt die Häufigkeit der vergebenen Labels [1].
Zoom
Abb. 2 Übersicht des entwickelten Workflows. Der Galar-Datensatz bildet die Grundlage für die Entwicklung energieeffizienter Modelle zur Lokalisation und Anomaliedetektion. Beide Pfade werden in einem kompakten Multi-Task-Modell vereint und für die Anwendung in Edge-KI-Systemen der Kapselendoskopie optimiert. Modelle zur Anomaliedetektion und Lokalisation entwickelt in Zusammenarbeit mit der Universität Tübingen, Lehrstuhl für Eingebettete Systeme [2] [3] [4].