Methods Inf Med 1987; 26(01): 31-39
DOI: 10.1055/s-0038-1635480
Original Article
Schattauer GmbH

A Method of Medical Knowledge Base Augmentation

Eine Methode zur Erweiterung medizinischer Wissenssammlungen
S. Lester
1   From the School of Medicine, University of Washington, Seattle, and the National Library of Medicine, Bethesda, MD, USA
,
R. Rada
1   From the School of Medicine, University of Washington, Seattle, and the National Library of Medicine, Bethesda, MD, USA
› Author Affiliations
Further Information

Publication History

Publication Date:
16 February 2018 (online)

Preview

Summary

The Medical Subject Headings (MeSH) of the National Library of Medicine may be viewed as a semantic network. The relationships in this semantic network are of a broader-than/narrower-than type. A knowledge base of this type may be augmented by adding new terms and new relationships to the network. The Current Medical Information and Terminology (CMIT) of the American Medical Association represents a rich source of relationships for the disease terms of MeSH. A subset of MeSH was augmented with the knowledge from a subset of CMIT using a matching and similarity strategy. The matching portion of the experiment showed that about half of CMIT may be directly merged with MeSH based on exact and partial matches and utilization of alternate and synonym terms from CMIT. The similarity portion of the experiment showed that a method of merging based on similarity of features is a workable approach to incorporating knowledge into MeSH when lexical matches are not available. Evaluation of the resulting merged knowledge base suggested that the etiology property of CMIT was the most highly inherited property. The augmented knowledge base was used as a basis for an automatic indexer. The indexer was less accurate after augmentation than before. One key difficulty stemmed from the way that CMIT was encoded into MeSH. More powerful encodings of CMIT into MeSH are being pursued. Building on MeSH, CMIT, and other such knowledge bases that already exist on the computer is one way to try to develop intelligent medical computer systems.

Die Sammlung von medizinischen Schlagwörtern (Medical Subject Headings = MeSH) der US-Staatsbibliothek für Medizin kann als ein semantisches Netzwerk betrachtet werden. Die Relationen in diesem semantischen Netzwerk sind von der Art »weiter als« und »näher als«. Eine Wissensdatenbasis dieser Art kann durch Hinzufügen neuer Begriffe und Relationen vergrößert werden. Die »aktuelle medizinische Information und Terminologie« (CMIT) der Amerikanischen Medizinischen Gesellschaft (AMA) ist eine reiche Quelle für Relationen zwischen den Krankheitsbegriffen von MeSH.

Eine Untergruppe von MeSH wurde mit den Informationen einer Untergruppe von CMIT unter Verwendung einer Matching- und Gleichheitsstrategie vergrößert. Der erste Teil dieses Versuchs zeigt, daß etwa die Hälfte von CMIT direkt mit MeSH verbunden werden kann, entweder durch eine exakte oder eine teilweise Anpassung oder durch den Gebrauch von alternierenden und synonymen Begriffen von CMIT. Die Gleichheitsstrategie in diesem Versuch zeigt, daß eine Methode des Verbindens, die auf Gleichheit von Kennzeichen beruht, ein Ansatz ist, um Wissen in MeSH einzubauen, falls keine lexikalische Zuordnung zur Verfügung steht. Die Auswertung der erzeugten Datenbasis erweist, daß der Ätiologie-Anteil von CMIT der am besten übertragbare ist.

Die vergrößerte Datenbasis wurde als Basis für eine automatische Indizierung benutzt. Diese Indizierung war weniger gut als die, die mit der ursprünglichen Datenbasis durchgeführt wurde. Eine Hauptschwierigkeit resultierte aus der Art, wie CMIT in MeSH eingebaut wurde. Eine wichtige Aufgabe ist es, diesen Vorgang zu verbessern. Die Implementierung von MeSH, CMIT und anderen existierenden Wissensbasen in den Rechner ist ein Weg, intelligente medizinische Computersysteme zu entwickeln.