A free text data collection system has been developed at the University of Illinois
utilizing single word, syntax free dictionary lookup to process data for retrieval.
The source document for the system is the Surgical Pathology Request and Report form.
To date 12,653 documents have been entered into the system.
The free text data was used to create an IRS (Information Retrieval System) database.
A program to interrogate this database has been developed to numerically coded operative
procedures. A total of 16,519 procedures records were generated. One and nine tenths
percent of the procedures could not be fitted into any procedures category; 6.1% could
not be specifically coded, while 92% were coded into specific categories. A system
of PL/1 programs has been developed to facilitate manual editing of these records,
which can be performed in a reasonable length of time (1 week). This manual check
reveals that these 92% were coded with precision = 0.931 and recall = 0.924. Correction
of the readily correctable errors could improve these figures to precision = 0.977
and recall = 0.987. Syntax errors were relatively unimportant in the overall coding
process, but did introduce significant error in some categories, such as when right-left-bilateral
distinction was attempted.
The coded file that has been constructed will be used as an input file to a gynecological
disease/PAP smear correlation system. The outputs of this system will include retrospective
information on the natural history of selected diseases and a patient log providing
information to the clinician on patient follow-up.
Thus a free text data collection system can be utilized to produce numerically coded
files of reasonable accuracy. Further, these files can be used as a source of useful
information both for the clinician and for the medical researcher.
An der Universität Illinois ist ein Klartext-Datensammelsystem entwickelt worden,
welches zum Datenretrieval ein syntaxfreies, maschinengespeichertes Einzelwort-Lexikon
verwendet. Das Ausgangsdokument für das System ist das Surgical Pathology Request
and Report Formular. Bis heute sind 12 653 Dokumente in das System eingespielt worden.
Die Klartextdaten wurden benutzt, um eine 1RS (Information Retrieval System) Datensammlung
zu schaffen. Ein Programm zur Befragung dieser Datensammlung ist für numerisch verschlüsselte
Operationsverfahren entwickelt worden. Insgesamt wurden 16 519 Operationsberichte
erstellt. 1,9% der Operationsverfahren konnten nicht in eine Kategorie eingeordnet
werden; 6,1% konnten nicht spezifisch verschlüsselt werden, während 92% in spezifische
Kategorien eingeordnet wurden. Um die manuelle Überarbeitung dieser Berichte in einer
angemessenen Zeitspanne (eine Woche) zu gestatten, wurde ein System von PL/1 Programmen
entwickelt. Die manuelle Überprüfung ergab, daß diese 92% mit einer Präzision von
0,931 und einer Recall-Rate von 0,924 verschlüsselt wurden. Bei Korrektur leicht zu
verbessernder Fehler konnte die Präzision auf 0,977 und die Recall-Rate auf 0,987
verbessert werden. Im gesamten Kodierungsprozeß waren Syntaxfehler relativ unbedeutend,
brachten jedoch wesentliche Fehler in manche Kategorien ein, so z.B. wenn eine Unterscheidung
in rechts-links-bilateral versucht wurde.
Die so erstellte verschlüsselte Datei wird als Eingabematerial für ein Korrelationssystem
»Gynäkologische Krankheit/PAP-Abstrich« benutzt. Die Ausgabe dieses Systems enthält
retrospektive Informationen über den Verlauf ausgewählter Krankheiten und ein Patienten-Logbuch
mit Informationen für den Kliniker hinsichtlich der Patientennachsorge.
So kann ein Klartext-Datensammelsystem dazu benutzt werden, um mit hinreichender Genauigkeit
numerisch verschlüsselte Dateien zu erstellen. Weiterhin können diese Datenbestände
als eine Quelle nützlicher Informationen sowohl für den Kliniker als auch für den
medizinischen Forscher dienen.
Key-Words
Automatic Coding - Free Text Processing - Surgical Operative Procedures
Schlüssel-Wörter
Automatische Verschlüsselung - Klartextverarbeitung - chirurgische Operationsverfahren