Methods Inf Med 1962; 1(02): 38-50
DOI: 10.1055/s-0038-1636196
Original Article
Schattauer GmbH

Transformations of Variables in Clinical-Therapeutical Research [*)]

TRANSFORMATION VON VARIABLEN IN DER KLINISCH-THERAPEUTISCHEN FORSCHUNG
L. Martin
Further Information

Publication History

Received: 12 January 1962

Publication Date:
17 February 2018 (online)

When the clinician gets the figures of body measurements or laboratory and functional tests, he has to see if the results fall into the range of normal variability or outside. This may only be defined by reference to an alleged homogeneous population whose description implies statistical tools in order to specify the distribution of clinical features. In clinical-therapeutical research like clinical trials, a more elaborate knowledge of the kind of distributions of the characters under study is needed. Very often, for the validity of the statistical calculations, the raw data will not be used as such and appropriate transformations of the data will be used.

After recalling the importance of distribution functions in clinical research, the author gives the 1—99 or 2,5—97,5 percentile method of assessing the cases normally belonging to the population. The scale of coefficient of variation of clinical measurements goes from 0,5 % for the basal temperature to 65 % for the minimal effective dosis of digitalics.

To ensure the legality of statistical reduction of data and analysis, such as analysis of variance, it is often necessary to perform transformations of raw data. Some of these lead to useful graphical representations on special papers.

For continuous variables such as height, the author considers the probit transfpr-mation of percentages. The r ankit is used in the case of ordinal data. The logarithmic transformation of data such as body weight, survival time in leukaemia and other cancers, gives straight lines after probit transformation of the cumulated percentages.

For discontinuous variables or bi nomial variab 1 e s such as counts of improved patients by several treatments, the angular transformation gives a clear graphical representation of the results of clinical trials (binomial probability paper).

In biological assay, probits and logits are widely used. For Poisson variables like Thoma’s chamber and radioactive counts, the root square transformation is appropriate. A Poisson-sum probability paper allows a quick graphic test of the Poisson distribution.

Finally, for recurrent events such as the RR interval in ECG of complete arrhythmia by auricular fibrillation, the concept of imminence (MACREZ) of occurrence of a further systole involves a simple transformation of the frequency function of the RR interval and allows an easier dissection of this frequency function in several components.

In conclusion the author shows the necessity for the research clinician to have a good training in mathematics, statistics, sampling theory and practice and emphasizes the interest of collaboration amongst clinicians both at national and international levels.

Bei den Ergebnissen von Körpermessungen, Laboratoriumsuntersuchungen oder Funktionstests muß der Kliniker untersuchen, ob die Resultate noch im Rahmen der normalen Variabilität oder außerhalb davon liegen. Dies kann geschehen durch Bezug der Werte auf eine als homogen angenommene Grundgesamtheit, die durch statistische Kennziffern beschrieben werden kann.

In der klinisch-therapeutischen Forschung ist eine eingehendere Kenntnis der Verteilungsform des zu untersuchenden Merkmals erforderlich. Häufig sind die erhaltenen Urwerte für eine statistische Beurteilung nicht brauchbar; in solchen Fällen empfiehlt sich eine geeignete Transformation der Daten. Die Bedeutung verschiedener Verteilungsfunktionen - wird kurz gestreift. Zur Abschätzung der Zugehörigkeit von Meßdaten zur Normalverteilung eignen sich die Perzentilen 1—99 bzw. 2,5—97,5. Die Variationskoeffizienten klinischer Messungen reichen Von 0,5 % (bei der Basaltemperatur) bis 65 % (für die minimale Effektivdosis bei Digitalispräparaten). Gewisse graphische Spezialpapiere sind bei der für nötig erachteten Transformation der Daten recht nützlich. Für die Trans formation von kontinuierlichen Variablen empfiehlt der Vortragende die Probit - Transformation der Prozentwerte. Im Fall von Rangdaten wird das Rankit angewandt. Die logarithmische Transformation von Daten wie z.B.

Körpergewicht, Überlebenszeiten bei Leukämie oder Krebs ergibt nach Probit-Transformation der Summenprozente gerade Linien. Für diskontinuierliche und binomische Variablen (wie z.B. die Anzahl gebesserter Fälle bei verschiedenen Therapieformen) ergibt die Winkel-Transformation von FISHER eine klare graphische Darstellung der Ergebnisse (binomisches Wahrscheinlichkeitspapier).

Bei biologischen Untersuchungen sind Probits und Logits sehr gebräuchlich. Für Poisson-verteilte Variablen, wie z. B. Zählkammerwerte oder radioaktive Impulsmessungen, ist die Quadratwurzel - Transformation geeignet. Ein Poisson-Summen - Wahrsche inlich -keitspapier erlaubt eine schnelle graphische Kontrolle, ob eine Poisson-Verteilung vorliegt.

Bei wiederkehrenden Ereignissen, wie z. B. dem RR-Intervall beim EKG einer kompletten Arrhythmie, schließt der Begriff der Imminenz einer weiteren Systole eine einfache Transformation der Frequenzfunktion des RR-Intervalls ein und erlaubt eine leichtere Zerlegung dieser Frequenzfunktion in ihre verschiedenen Komponenten.

Zusammenfassend zeigt Vortragender die Unumgänglichkeit einer ausreichenden Schulung auf mathematischem und statistischem Gebiet einschließlich Stichprobenverfahren für den klinischen Forscher und betont die Bedeutung entsprechender Zusammenarbeit auf nationaler und internationaler Ebene.

TRANSFORMATION DES VARIABLES DANS LA RECHERCHE CLINIQUE-THERAPEUTIQUE

Lorsque le clinicien enregistre des mensurations somatiques ou reçoit les résultats d’épreuves de laboratoire ou de tests fonctionnels, il doit se demander si les résultats tombent dans la zone de variabilité normale ou au dehors. Ce critère ne peut être défini que par référence à une .population supposée homogène, dont la description implique un attirail statistique pour spécifier la distribution des caractères cliniques. Dans les recherches cliniques-thérapeutiques, telles que les essais cliniques, une connaissance plus élaborée du type de distribution des caractères étudiés est nécessaire. Très souvent, pour la validité des calculs statistiques, les données brutes ne seront pas utilisées telles quelles et des transformations appropriées seront recherchées.

Après avoir rappelé l’importance des fonctions des distributions dans les recherches cliniques, l’auteur donne la méthode des percentiles 1—99 ou 2,5—97,5, pour délimiter les cas qui appartiennent normalement à la population. L’échelle du coefficient de variation des mesures cliniques s’étage de 0,5 % pour la température basale à 65 % pour la dose minima effective de digitaliques.

Pour assurer la légalité de la réduction statistique des données et de leur analyse — l’analyse de la variance par exemple —., il est souvent nécessaire d’effectuer des transformations sur les données brutes. Parmi celles-ci, un certain nombre de transformations conduisent à des représentations utiles sur des graphiques spéciaux.

Pour des variables continues telles que la taille, l’auteur rappelle la transformation pro bit des pourcentages cumulés. La méthode des rankits est utilisée dans le cas de données sériées par ordre de grandeur. La transformation logarithmique des grandeurs telles que le poids corporel, le temps de survie pour des leucémies et autres types de cancers, conduit à des lignes droites après transformation probit des pourcentages cumulés.

Dans le cas de variables discontinues ou variables binomiales, telles que énu-mérations des patients améliorés par différents traitements, la transformation angulaire fournit une représentation graphique claire des résultats d’essais cliniques (graphique de probabilité binomiale).

Dans les essais biologiques, l’analyse est souvent conduite au moyen de probits ou de logits. Pour les variables de Poisson telles que numérations en chambre de Thoma ou de désintégrations radio-actives, la transformation racine carrée est appropriée. Un graphique somme de probabilités de Poisson permet un test graphique rapide de la distribution de Poisson.

Enfin, pour les événements récurrents, tels que l’intervalle RR dans 1’ E. C. G. des cas d’arythmie complète par fibrillation auriculaire, le concept d’imminence (MACREZ) de l’occurrence d’une systole suivante implique une transformation simple de la fonction de fréquences de l’intervalle RR et permet une dissection plus fine de cette fonction de fréquences en différentes composantes.

En conclusion, l’auteur montre la nécessité pour le clinicien qui s’occupe de recherches d’avoir une bonne formation en mathématique, statistique, théorie et pratique de l’échantillonnage. De plus, il souligne l’intérêt de la collaboration entre cliniciens tant à l’échelle nationale qu’ internationale.

*) Paper presented at the International Seminar on Medieal Doeumentatiorl and Stalisties, Getober 16–28, Berlin, Germany.


 
  • Bibliography

  • 1 Aitchison J., and Brown J. A. C.. The Lognormal Distribution. Cambridge Univ. Press; 1957
  • 2 Anscombe F. J.. The transformation of Poisson binomial and negative binomial data. Biometrika 35: 246-254 1948;
  • 3 Augsberger A.. Quantitatives zur Therapie mit Herzglykosiden.. Die Medizinische Welt 20: 1471 1951;
  • 4 Bartlett M. S.. The Use of Transformations. Biometrics 3: 39-52 1947;
  • 5 Beall G.. The transformation of data from entomological field experiments so that the analysis of variance becomes applicable. Biometrika 32: 243-262 1942;
  • 6 Beall G.. Data in binomial or non binomial distribution in Statistics and Mathematics in Biology. The Iowa State College Press; Ames: 1954
  • 7 Bellville J., Bross I., and Howland W.. A method for the clinical evaluation of antiemetic agents. Anesthesiology 20: 753-760 1959;
  • 8 Berkson J.. Why I prefer logits to probits. Biometrics 7: 327-339 1951;
  • 9 Berkson J.. A statistically precise and relatively simple method of estimating the bio-assav with quantal responses, based on the logistic function. J. Am. Stat. Assoc 48: 565-599 1953;
  • 10 Berkson J.. Tables for use in estimating the normal distribution function by normit analysis. Biometrika 44: 431-435 1957;
  • 11 Bertrand I.. et Mme Thérèse Gayet-Hallion.. Induction mitogénétique dans la thyroïde du rat. Ajustement statistique des données par les distributions de Poisson et de Polya. C. Rendus Acad. Sei. (Paris), 235: 214-216 1952;
  • 12 Bertrand I.. et Quivy, Denise.. Analyse factorielle de l’action conjointe inhibiteur-activateur sur la coagulation plasmatlque. Arch. Int. Pharmacodyn 98: 193-209 1954;
  • 13 Bliss C. I.. The calculation of the dosage-mortality curve. Ann. Applied Biol 22: 134-167 1935;
  • 14 Boag J. W.. Maximum likelihood estimates of the proportion of patients cured by cancer therapy. J. Roy. Stat. B. 11: 15-44 1949;
  • 15 Bourgain R.. Action anticoagulante d’un extrait lipoïdique de cerveau de boeuf. CR. Soc. Biol 150: 221 1956;
  • 16 Bross I. D.. How to use ridit analysis. Biometrics 14: 18-38 1958;
  • 17 Burn J. H., Finney D. J., and Goodwin L. G.. Biological Standardization. Oxford University Press; 1950
  • 18 Campbell G. A.. Probability curves showing Poisson’s exponential summation. Bell System Technical J 2: 95-113 1923;
  • 19 Claringbold P. J., and Emmens C. M.. Quantal responses. in De Jonge H.. ed. pp. 72-87 1961
  • 20 Cochran W. G.. Some difficulties in the statistical analysis of replicated experiments. Emp. J. Exp. Agric 1: 157-175 1938;
  • 21 Cochran W. G.. and Cox, Gertrude M. Experimental Designs. Wiley, New York; Chapman and Hall, London: 2nd ed. 1957
  • 22 Cramer H.. Mathematical Methods of Statistics. Princeton Univ. Press; Princeton: 1946
  • 23 Dacie J. V.. Practical Haematology. 2nd ed. Churchill, London: 1956
  • 24 De Jonge H.. ed.: Quantitative Methods in Pharmacology. North Holland Pub. Co.; Amsterdam: 1961
  • 25 Doull J.. Clinical evaluation studies in lepromatous leprosy, first series. Inst. J. Leprosy, 22: 377-402 1949;
  • 26 Dufrenoy J.. Using the arc tangent scale for quantitative Methods. in De Jonge H.. ed. 1961. pp. 368-372.
  • 27 Eggenberger E., et Polya G.. Uber die Statistik verketteter Vorgänge. Z. f. angewandte Mathematik und Mechanik 3: 279-289 1923;
  • 28 Finney D. J.. On the distribution of a variate whose logarithm is normally distributed.. J. Roy. Stat. Soc. (Suppl. 07) 155-161 1941;
  • 29 Finney D. J.. Probit analysis. Cambridge Univ. Press; 1st ed. 1947. 2nd ed. 1952.
  • 30 Fischer A.. Gerinnungszeit und Konzentration des ‘Gerinnungsstoffes. Biochem. Z 278: 320-325 1935;
  • 31 Fisher, Sir, R. A. On the dominance ratio. Proc. Roy. Soc. Edinburgh 42: 321-341 1922;
  • 32 Fisher, Sir, R. A. The case of zero survivors (app. to Bliss 1935). Ann. Applied Biol 22: 104-166 1935;
  • 33 Fisher, Sir, R. A. and Mather K.. The inheritance of style length in Ly-thrum salicaria. Ann. of Eugenics 12: 1-23 1943;
  • 34 Fisher, Sir, R. A. and Yates F.. Statistical Tables for biological, agricultural and medical research. Oliver and Boyd; London: 5. ed., 1957
  • 35 Florkin M.. et Duchateau, Ghislaine. Contribution à l’étude des protéines du milieu intérieur. Le graphique de précipitation du sérum humain par les phosphates. Bull. Acad. Roy. de Méd. de Belg. VI série, 8: 342-385 1943;
  • 36 Gaddum J.. Lognormal distribution. Nature (London) 156: 463-466 1945;
  • 37 Glasser O.. Medical Physics. T. I and II. Year Book Publ.; Chicago: 1950
  • 38 Gordon E.. La courbe standard et les limites physiologiques d’adaptation à l’obscurité au moyen de l’adaptomètre de Gold-mann-Weekers.. Thèse Médecine n” 2369, Ed. Médecine et Hygiène; Genève: 1956
  • 39 Grimm H.. Transformation zur Zufallsvariablen. Biom. Zeitschr 2: 164-182 1960;
  • 40 Grimm H.. Quelques problèmes de numérations bactériennes. Biom.-Praxi-métrie 2: 1-18 1961;
  • 41 Gumbel E. J.. Statistics of Extremes. Columbia University Press; N. Y.: 2nd print 1960
  • 42 Haid A.. Statistical Theory with engineering applic.. Wiley, N. Y.: 1952
  • 43 Jenss Rachel. Age variations of systolic blood pressure. in United States Army officers; 1934
  • 44 Kapteyn J.. Skew frequency curves in Biology and Statistics. Noordhoff, Groningen: 1903
  • 45 Keller R., Linder A., und Storck H.. Vergleichende Prüfung von antipruriginösen Salben. Dermatologica (Basel), 121: 63-70 1960;
  • 46 Kimball A. W.. Estimation of mortality intensities in animal experiments. Biometrics 16: 505-521 1960;
  • 47 Ledermann S.. Alcool, Alcoolisme, Alcoolisa-lion. Pr. Univ. de France; 1956
  • 48 Little A., and Smith G.. Intervals between onsets of multiple cases of poliomyelitis in families. Am. J. Hygiene, 01: 302-313 1955;
  • 49 Linder A.. Statistische Methoden für Naturwissenschaftler, Mediziner und Ingenieure. Dritte Aufl, Birkhäuser, Basel, 1960. — 50 Macrez, CL: Essai d’analyse de l’irrégularité ventriculaire dans l’arythmie complète (notion de réceptivité ventriculaire). Presse médicale (Paris) 68: 607-608 1960;
  • 51 Martin L.. Probits normaux et probits triangulaires. Bull. Inst. Agron. et Stations Rech, de Gembloux 19: 346-386 1952;
  • 52 Martin L.. Application des méthodes statistiques à la biologie et aux sciences médicales. Revue de Médecine et Pharmacie (Bruxelles) 12: 147-171 1956;
  • 53 Martin L.. Le poids de référence chez l’adulte en biométrie ou clinique. Travaux Soc. méd. belge d’Education physique et de Sports 10: 53-111 1956-57.
  • 54 Martin L.. Etude biométrique de grandeurs somatiques recueillies sur les conscrits et recrues belges et de leur évolution.. Inst. Nat. de Stat; Bruxelles: 1958. a.
  • 55 Martin L.. Analyse et ajustement des courbes de fréquences unimodales par la méthode des probits.. Bull. Inst. Int. de Stat. 36: 43-59 1958; b.
  • 56 Martin L.. Aspects biométriques du titrage de substances anticoagulantes.. Arch, belges de Méd; sociale: 1256-1268 1959
  • 57 Martin L.. Homométrie, allométrie et cograduation en biométrie générale.. Biom. Zeitschr 2: 73-97 1960; a.
  • 58 Martin L.. Modèle probabiliste de la récupération de la sensibilité lumineuse après éblouissement.. Bull. Ac. Roy. de Belg. (Cl. Sc.) 5e Série 46: 395-410 1963; b.
  • 59 Martin L.. Imminence et temps d’attente d’une réaction tout ou rien. Comm.. 33e Congrès de l’L L S.; Paris: 1961. a.
  • 60 Martin L.. Etude biométrique de la natalité en Belgique sur la base du recensement de 1947.. Bull. Assoc. Licenciés en Se. Actuarielle issus de l’Université Libre de Bruxelles n1 2: 25-53 1961; b.
  • 61 Martin L.. Lois gaussienne et log-gaussienne en Biologie et en Médecine.. To appear in Biométrie-Praximétrie (Bruxelles). 1962
  • 62 Martin L., et Bastenier H.. Application de la méthode des essais biologiques à droites parallèles au dosage des hémo-agglutinines faibles.. C. R. Soc. Biol. 149: 1304-13 6 1955;
  • 63 Martin L., Bourgain R., et Reuse J.. Action anticoagulante d’un extrait lipoïdique de cerveau de boeuf. Etude biométrique. Phar-maceutisch Weekblad 92: 932-972 1957;
  • 64 Martin L.. et Cotte-leer, Christiane. Etude quantitative de la courbe de mortalité d’acares soumis à l’action du gammexane et du DMC. C. R. Soc. Biol 152: 1026-1028 1958;
  • 65 Mosteller F., and Tukey J.. The uses and usefulness of binomial probability paper. J. Am. Stat. Ass 44: 174-212 1949;
  • 66 Oberhoffer G., Schmitz-Draeger H. G., und Thurn P.. Die Strahlenbehandlung der chronischen Leukämie. Strahlentherapie 108: 325-355 1959;
  • 67 Oeser H.. Personal communication. 1960
  • 68 Pearson E. S., and Hartley H. O.. Biometrika tables for Statisticians.. I. Cambridge Univ. Press; 1954
  • 69 Pretorius S.. Skew bivariate frequency curves. Biometrika 22: 109-223 1930;
  • 70 Rashevsky N.. Mathematical Principles in Biology and their Applications.. Charles C. Thomas Pub.; Springfield, Ill.: 1961
  • 71 Reed L. J., and Berkson J. The application of the logistic function to experimental data. J. Phys. Chem 33: 760-779 1929;
  • 72 Schuerman H., und Schir-duan M.. Untersuchungen über Fragen der Penicillindosierung.. Klin. Wschr. 26: 526-528 1948;
  • 73 Student (Gösset, W.).. On the error of counting with a haemocytometer. Biometrika 5: 211-215 1908;
  • 74 Sutter J., et Tabah L.. La mortalité, phénomène biométrique. Population 7: 69-94 1952;
  • 75 Swaroop S.. Statistical Techniques in Medical Research.. 32d Ses. Int. Stat. Inst. Tokyo 1962. (preprint n1 68).
  • 76 Taylor L. R.. Aggregation, variance and the mean. Nature 189: 732-735 1961; a.
  • 77 Taylor L. R.. A power law transformation for aggregated populations. Biometrics 17: 498 1961; b.
  • 78 Teissier G.. La relation d’allométrie et sa signification statistique et biologique. Biometrics 4: 14-53 1948;
  • 79 Teissier G.. Choix des paramètres définissant une relation structurale linéaire dans la pratique biométrique. Biométrie-Praximétrie (Bruxelles) 2: 137-158 1961;
  • 80 Thorndike F.. Applications of Poisson’s probability summation. Bell System Techn. J 5: 604-624 1926;
  • 81 Tivey H.. The prognosis of survival in chronic, granulocytic and lymphocytic leukemia. Am. J. Roentgenol 72: 63-93 1954;
  • 82 Ver-hulst P. F.. Notice sur la loi que la population suit dans son accroissement. Corr. math, et Phys. (Bruxelles) 10: 113-121 1838;
  • 83 Wagner G.. Über das Testen der Zuverlässigkeit von Laboratoriumsmethoden u. -befunden. Medical Documentation — Med. Dok 5: 21-26 1961;
  • 84 Watson G. S., and Wells W. T.. On the possibility of improving the mean useful life of items by eliminating those with short lives. Technometrics 3: 281-298 1961;
  • 85 Weber Erna. Grundriß der biologischen Statistik. 3te Aufl. Gustav Fischer; Jena: 1961
  • 86 Weber A., und Linder A.. Auswertung der Ergebnisse eines Versuches zur Trachombekämpfung. Biom. Zeitschr 2: 217-229 1900;
  • 87 Wechsler D.. The Range of Human Capacities. Ballière, Tindall and Cox; London: 1935
  • 88 Winsor Ch.. Biometry. in Glasser O.. 1950 II, pp. 105-126.
  • 89 Wootton I. D., King E. J., Maclean Smith J.. The quantitative approach to hospital ticchemistry. Brit. Med. Bull 7: 307-311 1951;
  • 90 Zelen M.. Analysis of two-factor classifications with respect to life tests.. Contributions to Probability and Statistics, ed. by Olkin. Stanford Univ. Press; Stanford, California: 1960