B&G Bewegungstherapie und Gesundheitssport 2021; 37(02): 72-76
DOI: 10.1055/a-1382-0614
Wissenschaft

Statistische Signifikanz – was der p-Wert aussagt

Statistical significance: Interpreting the p-value
Maximilian Köppel
1   AG Onkologische Sport- und Bewegungstherapie, Medizinische Onkologie, NCT Heidelberg
2   DVGS e.V.
,
Katharina Eckert
3   IST-Hochschule für Management, Düsseldorf
,
im Namen der AG Wissenschaft des DVGS e.V. › Author Affiliations

Zusammenfassung

Der Begriff der statistischen Signifikanz geht oft mit Missverständnissen einher. Dies liegt u. a. daran, dass sich mit den theoretischen Konzepten und Kenngrößen, die hinter dem Signifikanztesten liegen, zu wenig auseinandergesetzt wird. Hierzu gehört beispielsweise der p-Wert, der aussagt, mit welcher Wahrscheinlichkeit der beobachtete oder ein extremerer Effekt gefunden würde, wenn dieser Effekt in Wirklichkeit gar nicht existieren würde. Anhand des Beispiels eines Münzwurfs soll das Konzept des Nullhypothesensignifikanztestens erläutert werden, um ein besseres Verständnis für die Interpretation von wissenschaftlichen Ergebnissen zu erzeugen.

Summary

The concept of statistical significance is often accompanied by misunderstandings. This is due to the fact, among other things, that the theoretical concepts and parameters that lie behind the significance test are not dealt with adequately. This includes, for example, the p-value, which indicates the probability with which the observed or a more extreme “effect” would be found if this “effect” did not actually exist. The example of a coin toss is used to explain the concept of the null hypothesis significance test in order to create a better understanding of the interpretation of scientific results.



Publication History

Received: 28 August 2020

Accepted: 18 January 2021

Article published online:
16 April 2021

© 2021. Thieme. All rights reserved.

Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany

 
  • Literatur

  • 1 Morey RD, Hoekstra R, Rouder JN, Lee MD, Wagenmakers E-J. The fallacy of placing confidence in confidence intervals. Psychonomic bulletin & review 2016; 23: 103-123
  • 2 Zimbardo PG, Gerrig RJ. Psychologie. 16., aktualisierte Aufl. ed. München [u. a. ]: Pearson Studi-um; 2004
  • 3 Sackett DL, Rosenberg WM, Gray JM, Haynes RB, Richardson WS. Evidence based medicine: what it is and what it isn’t. In: British Medical Journal Publishing Group; 1996
  • 4 Gigerenzer G, Marewski JN. Surrogate science: The idol of a universal method for scientific infer-ence. Journal of Management 2015; 41: 421-440
  • 5 Meehl PE. Theory-testing in psychology and physics: A methodological paradox. Philosophy of science 1967; 34: 103-115
  • 6 Savage LJ. The shifting foundations of statistics. Logic, Laws and Life. 1977: 3-18
  • 7 Cohen J. The Earth Is Round (p < .05). American Psychologist 1994; 49: 997-1003
  • 8 Lehmann EL. The Fisher, Neyman-Pearson theories of testing hypotheses: one theory or two?. Journal of the American statistical Association 1993; 88: 1242-1249
  • 9 Gigerenzer G. Mindless statistics. The Journal of Socio-Economics 2004; 33: 587-6061
  • 10 McGrayne SB. Die Theorie, die nicht sterben wollte: Wie der englische Pastor Thomas Bayes eine Regel entdeckte, die nach 150 Jahren voller Kontroversen heute aus Wissenschaft, Technik und Gesellschaft nicht mehr wegzudenken ist. Berlin, Heidelberg: Springer Spektrum; 2014
  • 11 Gigerenzer G, Krauss S, Vitouch O. The null ritual. The Sage handbook of quantitative methodolo-gy for the social sciences 2004; 391-408
  • 12 McShane BB, Gal D, Gelman A, Robert C, Tackett JL. Abandon statistical significance. The Amer-ican Statistician 2019; 73: 235-245
  • 13 Amrhein V, Greenland S, McShane B. Scientists rise up against statistical significance. In: Nature Publishing Group; 2019
  • 14 Wasserstein RL, Lazar NA. The ASA statement on p-values: context, process, and purpose.. In: Taylor & Francis; 2016
  • 15 Greenland S, Senn SJ, Rothman KJ. et al. Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. European journal of epidemiology 2016; 31: 337-350
  • 16 Bender R, Lange S. Adjusting for multiple testing—when and how?. Journal of clinical epidemiology 2001; 54: 343-349
  • 17 Sedgwick P. Clinical significance versus statistical significance. Bmj 2014: 348
  • 18 Kutschmann M, Bender R, Grouven U, Berg G. Aspects of sample size determination and power calculation illustrated on examples from rehabilitation research. Die Rehabilitation 2006; 45: 377-384