Bessere Statistik für kleine Stichproben: Hochschule Koblenz startet neues Forschungsprojekt

KOBLENZ/ REMAGEN. Wie lassen sich valide wissenschaftliche Ergebnisse gewinnen, wenn nur sehr wenige Daten vorliegen – etwa bei seltenen Erkrankungen oder bedrohten Tierarten? Dieser Frage widmet sich das neue, von der Deutschen Forschungsgemeinschaft (DFG) geförderte Forschungsprojekt von Prof. Dr. Markus Neuhäuser, Professor für Statistik am Campus Remagen der Hochschule Koblenz. Unter dem Titel „Die Nutzung einer modifizierten Tschebyscheff-Ungleichung für die statistische Analyse sehr kleiner Stichproben und die Verwendung nicht-robuster Teststatistiken“ wird untersucht, wie sich auch bei minimalen Fallzahlen aussagekräftige statistische Schlüsse ziehen lassen.

  • Porträt eines Mannes

    Prof. Dr. Markus Neuhäuser leitet das Forschungsprojekt an der Hochschule Koblenz (Bild: Hochschule Koblenz/ Susanne Dröppelmann)

Kleine Stichproben, große Bedeutung

In vielen Forschungsbereichen sind kleine Stichproben unvermeidlich – beispielsweise bei seltenen Erkrankungen oder bedrohten Tierarten. Oft liegen nur Gruppengrößen von sechs bis acht Individuen vor, verteilt auf zwei Geschlechter. Dennoch müssen auch solche Daten wissenschaftlich ausgewertet werden können, um Erkenntnisse über Krankheitsverläufe, Behandlungserfolge oder Populationsentwicklungen zu gewinnen. „Gerade in Studien mit unterrepräsentierten Gruppen ist es entscheidend, dass auch kleine Datensätze zuverlässig analysiert werden können“, betont Prof. Neuhäuser, der am Fachbereich Mathematik, Informatik, Technik lehrt.

Hintergrund: Wenn klassische Statistik an Grenzen stößt

Viele gängige statistische Verfahren setzen eine Normalverteilung der Daten voraus – eine Annahme, die bei kleinen Stichproben nicht überprüft werden kann. Hier kommen nichtparametrische oder exakte Verfahren zum Einsatz, die dank moderner Computertechnologie heute effizient anwendbar sind. Das Forschungsvorhaben von Prof. Neuhäuser geht darüber hinaus: Mithilfe einer modifizierten Tschebyscheff-Ungleichung sollen neue Ansätze entwickelt werden, die auch bei minimaler Datenbasis robuste Ergebnisse liefern.

Beispiele aus Medizin und Naturschutz

Prof. Neuhäuser bringt umfangreiche Erfahrung aus der Analyse seltener Ereignisse mit. So war er an Studien zum Retinoblastom, einem bösartigen Augentumor bei Kindern, beteiligt. Diese Erkrankung tritt nur bei etwa einem von 15.000 Kindern auf. Da die Teilnahme an klinischen Studien freiwillig ist, stehen Forschenden oft nur wenige Datensätze zur Verfügung – ein klassischer Fall für die im Projekt entwickelten Methoden.

Auch in der Ökologie spielen kleine Stichproben eine zentrale Rolle. Neuhäuser untersuchte etwa den Kakapo, eine vom Aussterben bedrohte Papageienart in Neuseeland: 1994 existierten nur noch 47 Individuen, heute sind es 247. Trotz der geringen Fallzahlen konnten statistische Analysen wichtige Hinweise auf den Erfolg von Schutzmaßnahmen liefern.

Ein weiteres Beispiel ist die Analyse von Vogelarten, die im 20. Jahrhundert eigenständig aus Australien nach Neuseeland eingewandert sind. Nur sieben Arten traten neu auf – und dennoch ließ sich ein klarer Zusammenhang mit klimatischen Veränderungen nachweisen.

Ziel: Ein Werkzeugkasten für kleine Stichproben

Das Projekt verfolgt das Ziel, bestehende Ansätze so zu erweitern, dass sie für verschiedene Datentypen und Testverfahren nutzbar werden. Am Ende könnte ein „Werkzeugkasten“ neuer Methoden entstehen, der Anwendern in Medizin, Biologie und anderen Lebenswissenschaften zuverlässige Ergebnisse bei kleinen Stichproben liefert.

Damit die neuen Verfahren unmittelbar genutzt werden können, ist die Entwicklung eines frei verfügbaren R-Pakets geplant. Ein R-Paket ist eine Sammlung von R-Code, Daten und Dokumentation in einem standardisierten Format, die die Funktionalität der statistischen Programmiersprache R erweitert. So sollen Forschende direkt von den neuen Methoden profitieren, ohne einen eigenen Code programmieren zu müssen.

Expertise und Rahmenbedingungen

Prof. Dr. Markus Neuhäuser gilt als international ausgewiesener Experte in den Bereichen nichtparametrische Statistik und statistische Analyse kleiner Stichproben. Er ist Lehrbuchautor, Mitherausgeber renommierter Fachzeitschriften und Gutachter für wissenschaftliche Organisationen weltweit.

Die Hochschule Koblenz bietet mit ihren leistungsfähigen Rechenressourcen und dem Aufbau eines KI-Clusters optimale Voraussetzungen für das Projekt. Zudem besteht eine Kooperation mit der Fakultät Statistik der TU Dortmund, die zusätzliche wissenschaftliche Synergien ermöglicht.

Dank der Förderung der DFG kann eine Promotionsstelle zur Unterstützung des Forschungsprojekts eingerichtet werden.