Die Natur macht keine Sprünge
In vielen wissenschaftlichen Analysen werden ursprünglich kontiunierliche Variablen künstlich in mehrere Gruppen unterteilt ("Kategorisierung"). Ein beliebter Anwendungsfall ist das Alter, das entweder dichotomisiert (z.B. ≤45 und >45) oder in noch mehr Kategorien unterteilt wird (z.B. 18-25, 26-35, 36-45, 46-55). Aus methodischer Sicht ist klar, dass diese Kategorisierung von kontinuierlichen Variablen zu falschen Schlussfolgerungen führt und deshalb unbedingt vermieden werden sollte. Ein offensichtlicher Grund sind Grenzfälle, beispielsweise werden beio der Dichotomisierung Personen mit einem Alter von 44 und Personen mit einem Alter von 46 in jeweils unterschiedliche Gruppen geteilt. In den seltensten Fällen wird dies der wahren Natur des untersuchten Falls entsprechen - und das ist genau das, was uns interessiert. Der Grundsatz, dass die Natur keine Sprünge macht ("natura non facit saltus") ist bereits seit Jahrhunderten bekannt und wurde unter anderem von den Gründern der Infinitesimalrechnung, Leibniz und Newton, mehrfach verwendet. Weitere Gründe, die zum Teil weniger offensichtlich sind, sind die Auswahl der Kategorien, die Unterschiedlichkeit in und damit mangelnde Vergleichbarkeit von verschiedenen Studien, das Verbrauchen von Freiheitsgraden, die Diskontinuität von Effekten (beim Überschreiten der Grenzen kommt es zu anderen Effekten), die Annahme, dass die Beziehung zwischen den einzelnen Intervallen des Prädiktors und der Outcome-Variablen flach ist (der gleiche Effekt wird für 18- und 25-jährige angenommen, wenn diese in einer Gruppe sind wie im obigen Beispiel) sowie der Verlust an Power und Präzision.
Der richtige Umgang mit nicht-linearen Zusammenhängen ist folglich nicht die Kategorisierung kontinuierlicher Variablen, sondern der Einsatz von bestimmten statistischen Techniken (z.B. fractional polynomials oder Splines), die zwar etwas mehr Expertise benötigen, dafür jedoch dafür sorgen, dass unsere Schlussfolgerungen mehr der unterliegenden Realität entsprechen, als dies die Kategorisierung von ursprünglich kontinuierlichen Variablen zulassen würde.