TY - JOUR AU - Böhringer, Daniel; Lang, Stefan J.; Daniel, Moritz Claudius; Lapp, Thabo; Reinhard, Thomas TI - Automatisierte Zuordnung von ICD- und Alpha-ID-Codes zu „Real-World“-Arztbriefdiagnosen durch die „word2vec“-Methode TT - Unsupervised Linkage between ICD- and Alpha-ID Codes and Real-World Diagnoses from Medical Reports by Means of the “word2vec” Method SN - 0023-2165 SN - 1439-3999 PY - 2019 JO - Klin Monbl Augenheilkd JF - Klinische Monatsblätter für Augenheilkunde LA - DE VL - 236 IS - 12 SP - 1413 EP - 1417 DA - 2019/12/05 KW - Diagnosen KW - word2vec KW - Arztbrief AB - Hintergrund Für eine wissenschaftliche Auswertung von Arztbriefen bedarf es aufgrund unterschiedlicher Terminologien und dem häufigen Gebrauch von Synonymen der Transformation in ein normiertes Codesystem wie bspw. ICD-10 oder Alpha-ID. Das sog. „Word Vector Embedding“ erscheint für die Generierung des dafür erforderlichen Thesaurus geeignet, da hierüber – nach geeignetem Training des zugrunde liegenden neuronalen Netzwerkes – synonyme Diagnosen unabhängig von der Schreibweise automatisch identifiziert werden können.Methoden Es wurden alle Arztbriefe von insgesamt 50 000 Patienten anonymisiert extrahiert. Diagnosen, die aus mehreren Wörtern bestehen, wurden mittels Phrasenerkennung in Einzelwörter verschmolzen und das „word2vec“-Modell auf dem Textkorpus von 352 Megabytes trainiert. Insgesamt 3742 Diagnosen bzw. ophthalmologische Interventionen wurden aus den Arztbriefen halbautomatisch extrahiert. Die ophthalmologischen ICD- und Alpha-ID-Codes wurden zusammen mit den offiziellen Beschreibungen von der Website des DIMDI heruntergeladen und die ophthalmologischen Diagnosen/Interventionen aus den Arztbriefen mit den jeweils im „word2vec“-Modell nächstgelegenen ICD- und Alpha-ID-Codes automatisiert verknüpft.Ergebnisse Es wurden von „word2vec“-Modell 90% der Arztbriefdiagnosen den korrekten ICD-10-Codes zugeordnet. Auf Ebene der viel feiner aufgelösten Alpha-ID-Codes betrug die Quote korrekter Zuordnungen nur 76%. Die Interventionen wurden in 92% der korrekten Indikation zugewiesen. Als Fehlerquellen für inkorrekte oder fehlende Zuordnungen wurden seltene Erkrankungen, ungewöhnliche Bezeichnungen und Codedegeneration in der offiziellen DIMDI-Datei identifiziert.Diskussion Aus „Real-World“-Arztbriefen und der offiziellen Alpha-ID-Datei und lässt sich mit der „word2vec“-Methode ein Diagnosenthesaurus generieren. Dieser könnte, eine geringfügige manuelle Überarbeitung vorausgesetzt, zukünftig für eine automatische Extraktion von Diagnosen aus Arztbriefen verwendet werden. PB - Georg Thieme Verlag KG DO - 10.1055/a-1023-4490 UR - http://www.thieme-connect.de/products/ejournals/abstract/10.1055/a-1023-4490 ER -