Subscribe to RSS
DOI: 10.1055/s-0045-1811084
Edge-KI in der Kapselendoskopie: Lokalisierung und Anomalieerkennung auf dem Galar-Datensatz
Authors
Einleitung: Die Kapselendoskopie erlaubt eine minimalinvasive Bildgebung des Dünndarms. Aufgrund begrenzter Rechen- und Batterieleistung in der Kapsel sind klassische KI-Verfahren bislang nur retrospektiv nutzbar. Eine intelligente Vorverarbeitung direkt in der Kapsel („Edge-KI“) k önnte daher den klinischen Nutzen deutlich steigern.
Ziele: Ziel dieser Arbeit ist die Entwicklung und Bewertung eines energieeffizienten KI-Ansatzes zur gleichzeitigen Lokalisation der Kapsel im Gastrointestinaltrakt und Detektion pathologischer Befunde. Der Fokus liegt auf ressourcenschonender und effizienten Bildanalyse in Echtzeit zur Integration in zukünftige Kapselgenerationen. Dies wird erstmals am Dresdner Galar-Datensatz demonstriert, der im Vergleich zu bisherigen Kapselendoskopie-Datensätzen eine breitere und detailliertere Annotation bietet.
Methodik: Grundlage bildet der Galar-Datensatz mit über 3,5 Millionen Bildern aus 80 vollständigen Kapseluntersuchungen. Für die Anomalieerkennung wurden verschiedene KI-basierte Strategien entwickelt, darunter Autoencoder, semi-supervised Klassifikation und Ensemble-Modelle [3]. Zur Organdetektion wurde auf Basis von [2] ein leichtgewichtiges CNN mit einem Hidden-Markov-Modell (HMM) kombiniert. Zusätzlich wurde ein kompaktes Multi-Task-Modell (MTL) auf dem Galar-Datensatz trainiert, das beide Aufgaben simultan löst [4].
Ergebnis: Das CNN-HMM-Modell erreichte eine Lokalisationsgenauigkeit von 92 % [4] bei minimalem Rechenaufwand (< 1 Mio. Parameter). Die Anomaliedetektion erzielte AUC-Werte von bis zu 77 % [3]. Der Multi-Task-Ansatz ermöglichte eine weitere Reduktion der Modellgröße ohne Leistungseinbußen. Alle Methoden erlauben eine kontextbasierte Bewertung einzelner Bilder mit anatomischer Einordnung ([Abb. 1] [2]).




Schlussfolgerung: Die Kombination aus Galar-Daten, HMM-gestützter Lokalisation und robusten Detektionsmodellen ermöglicht einen praxisnahen Edge-KI-Ansatz für die Kapselendoskopie. Sie bildet die Grundlage für eine autonome, ressourcenschonende Bildanalyse direkt in der Kapsel. Freigewordene Batteriekapazität kann z. B. für höherauflösende Kameras oder längere Aufnahmezeiten genutzt werden. Der Ansatz stellt einen ersten Schritt hin zu einer intelligenten Kapsel dar, die in zukünftigen Generationen erweiterte diagnostische und therapeutische Funktionen ermöglichen könnte ([Table 1]).
Methode |
AUC [%] |
Parameteranzahl |
---|---|---|
Baseline (Einzelklassifikation) |
ca. 61 |
25 Mio. |
Bildklassifikator |
74,94 |
1 Mio. |
Ensemble: SVM, Autoencoder, Klassifikator |
76,98 |
4 Mio. |
Verglichen werden ein konventioneller Baseline-Ansatz mit Einzelklassifikation, ein kompakter Bildklassifikator sowie ein Ensemble-Modell, das auf der Kombination von Autoencoder, Bildklassifikation und SVM basiert. Das Ensemble erzielt die höchste AUC bei gleichzeitig moderater Modellgröße – ein vielversprechender Ansatz für robuste Edge-KI-Systeme unter Hardware-Limitierungen [3].
-
Literatur
- 1 Galar – a large multi-label video capsule endoscopy dataset”. Le Floch, Maxime; Wolf, Fabian; McIntyre, Lucian; et al. Figshare+ 2025
- 2 „Precise Localization Within the GI Tract by Combining Classification of CNNs and Time-Series Analysis of HMMs.” Werner, J., Gerum, C., Reiber, M., Nick, J., Bringmann, O 2024. In: Cao, X., Xu, X., Rekik, I., Cui, Z., Ouyang, X. (eds) Machine Learning in Medical Imaging. MLMI 2023. Lecture Notes in Computer Science. vol 14349. Springer; Cham:
- 3 Werner J., Gerum C., Nick J., Floch M.L., Brinkmann F., Hampe J., Bringmann O.. 2025 Enhanced Anomaly Detection for Capsule Endoscopy Using Ensemble Learning Strategies. arXiv preprint arXiv. 2504.06039, Accepted at EMBC.
- 4 "Advancing Video Capsule Endoscopy: A Multi-Task Learning Approach", by Julia Werner, Oliver Bause, Maxime Le Floch, Franz Brinkmann, Jochen Hampe, Oliver Bringmann. Preprint 2025.
Publication History
Article published online:
04 September 2025
© 2025. Thieme. All rights reserved.
Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany
-
Literatur
- 1 Galar – a large multi-label video capsule endoscopy dataset”. Le Floch, Maxime; Wolf, Fabian; McIntyre, Lucian; et al. Figshare+ 2025
- 2 „Precise Localization Within the GI Tract by Combining Classification of CNNs and Time-Series Analysis of HMMs.” Werner, J., Gerum, C., Reiber, M., Nick, J., Bringmann, O 2024. In: Cao, X., Xu, X., Rekik, I., Cui, Z., Ouyang, X. (eds) Machine Learning in Medical Imaging. MLMI 2023. Lecture Notes in Computer Science. vol 14349. Springer; Cham:
- 3 Werner J., Gerum C., Nick J., Floch M.L., Brinkmann F., Hampe J., Bringmann O.. 2025 Enhanced Anomaly Detection for Capsule Endoscopy Using Ensemble Learning Strategies. arXiv preprint arXiv. 2504.06039, Accepted at EMBC.
- 4 "Advancing Video Capsule Endoscopy: A Multi-Task Learning Approach", by Julia Werner, Oliver Bause, Maxime Le Floch, Franz Brinkmann, Jochen Hampe, Oliver Bringmann. Preprint 2025.



