Management | Medizinische Statistik mit SAS Studio unter SODA | springerpflege.de

Springerpflege

nach oben

2019 | Management | Buch

Kapitel lesen Erstes Kapitel lesen

Medizinische Statistik mit SAS Studio unter SODA

verfasst von: Dr. Gisela Büchele, Martin Rehm, Prof. Dr. Rainer Muche

Verlag: Springer Berlin Heidelberg

Einloggen, um Zugang zu erhalten

Über dieses Buch

Statistische Auswertung - selbst gemacht!
Der in dem vorliegenden Buch beschriebene Zugang über SAS® OnDemand for Academics (SODA) erlaubt einen kostenfreien, browser-basierten Zugang zur SAS-Software. Dabei können unter SAS Studio in einer menügesteuerten Oberfläche statistische Auswertungen ausgeführt werden. Die Oberfläche ist auch in einer deutschsprachigen Version verfügbar.
Das Buch wurde so konzipiert, dass es sich hervorragend zum Selbststudium eignet. Zu Beginn wird eine Einführung in die Benutzung der SAS Studio Oberfläche gegeben. Anhand eines Beispieldatensatzes werden deskriptive Statistik, Korrelation/Regression, statistische Tests, Überlebenszeitanalyse sowie Fallzahlplanung mit zahlreichen Screen-Shots nachvollziehbar dargestellt. Eine Anleitung zur kostenlosen Registrierung von SAS-SODA ist ebenfalls enthalten. Darüber hinaus werden praktische Tipps zur Nutzung und Datenaufbereitung gegeben.

So können Sie Ihre statistische Auswertung sicher und schnell selbst erledigen.
Die AutorenDr. Gisela Büchele und Martin Rehm sind wissenschaftliche Mitarbeiter am Institut für Epidemiologie und Medizinische Biometrie, Ulm.Prof. Dr. Rainer Muche ist stellvertretender Institutsdirektor des Instituts für Epidemiologie und Medizinische Biometrie, Ulm.

Anzeige

Inhaltsverzeichnis

Frontmatter

1. Allgemeine Information

Zusammenfassung

Zum besseren Verständnis der im Buch eingesetzten Software-Anwendungen werden in diesem Kapitel Hintergründe erklärt und Tipps für die Anwendung gegeben. So werden in Abschn. 1.1 die verschiedenen SAS-Komponenten vorgestellt sowie grundlegende Informationen zur Anwendung von SAS Studio (Abschn. 1.2) und zur Datenhaltung und Datenaufbereitung mit Excel (Abschn. 1.3) vermittelt.

Gisela Büchele, Martin Rehm, Rainer Muche

2. Datenverwaltung mit Excel und SAS Studio

Zusammenfassung

In diesem Kapitel werden die wichtigsten Schritte erklärt, die erforderlich sind, um mit SAS Studio arbeiten zu können. In Abschn. 2.1 und 2.2 wird gezeigt, wie Excel-Dateien erstellt und gespeichert werden, um sie später in SAS Studio einzulesen (Abschn. 2.3). In den Abschn. 2.4 und 2.5 wird beschrieben, wie man SAS- und Textdateien importiert und im Folgenden damit arbeitet.

Gisela Büchele, Martin Rehm, Rainer Muche

3. Datenmanagement mit Excel und SAS Studio

Zusammenfassung

Bevor statistische Auswertungen mit einem Datensatz durchgeführt werden können, muss dieser oft zuerst aufbereitet werden. Dazu gehört das Ändern von Variablennamen und Variablenwerten (Abschn. 3.2), die Korrektur von Variablenformaten (Abschn. 3.3), das Hinzufügen (Abschn. 3.4) oder Löschen von Variablen (Abschn. 3.6) oder Beobachtungen (Abschn. 3.7), die Einteilung von Datenwerten in Klassen (Abschn. 3.5) sowie das Zusammenfügen von Dateien (Abschn. 3.9) und die Sortierung der Daten nach bestimmten Variablen (Abschn. 3.8). Des Weiteren ist dargestellt, wie Teilmengen eines Datensatzes (Abschn. 3.10) ausgewählt werden können. Die Bearbeitung des Datensatzes erfolgt in Excel oder SAS Studio.

Für manche der gezeigten Bearbeitungsschritte gibt es in SAS Studio keine entsprechenden Tasks. In diesen Fällen zeigen wir teilweise die Vorgehensweise per Programm-Code, ein Grundgerüst für die Programmierung wird in Abschn. 3.1 vorgestellt. Ist die Vorgehensweise in Excel einfach zu realisieren, verzichten wir aber auch gelegentlich auf die Darstellung als Programm-Code.

Gisela Büchele, Martin Rehm, Rainer Muche

4. Vorbemerkungen und Informationen zur statistischen Analyse medizinischer Daten

Zusammenfassung

In den folgenden Kap. 5 bis 11 werden Auswertungsmöglichkeiten, die mit SAS Studio ausgeführt werden können, beschrieben. Wir beschränken uns hierbei auf wichtige, in SAS Studio realisierte Analysen. Ausführliche statistische Hintergründe möchten wir im Rahmen dieses Buches nicht darstellen. Dazu verweisen wir auf die entsprechenden Literaturangaben im Anhang (Abschn. A.7), besonders empfehlen wir hierfür die Lehrbücher von Gaus/Muche und Weiß.

Gisela Büchele, Martin Rehm, Rainer Muche

5. Deskriptive Statistik

Zusammenfassung

Mit den Methoden der deskriptiven Statistik wird versucht, die Daten anhand von Grafiken und statistischen Maßzahlen zu beschreiben. Die deskriptive Statistik ermöglicht es, wichtige Informationen aus der Fülle der Daten herauszufiltern. In diesem Abschnitt werden die Möglichkeiten, die SAS Studio dazu bereitstellt, beschrieben.Bei den Auswertungen unterscheidet man zwischen Methoden für qualitativ/diskrete und stetige Variablen (s. Abschn. 4.1). Zuerst werden in Abschn. 5.1 Methoden der deskriptiven Statistik für qualitative bzw. diskrete Merkmale vorgestellt. In Abschn. 5.2 finden sich dann die Methoden für stetige Merkmale. Wie man stetige Merkmale gruppenspezifisch auswertet, zeigt dann der Abschn. 5.3

Gisela Büchele, Martin Rehm, Rainer Muche

6. Zusammenhang von Variablen

Zusammenfassung

In diesem Kapitel geht es um den Zusammenhang zwischen zwei Variablen. Im Fall qualitativer bzw. diskreter Variablen (Abschn. 6.1) wird dieser Zusammenhang mit zweidimensionalen Kreuztabellen anhand von absoluten und relativen Häufigkeiten beschrieben (Abschn. 6.1.1). In Abschn. 6.1.2 wird die einfache logistische Regression vorgestellt. In Abschn. 6.1.3 werden mehrere Einflussvariablen berücksichtigt, sodass wir die multivariate logistische Regression benötigen. Im Abschn. 6.2 wird die lineare Abhängigkeit zwischen zwei stetigen Variablen durch Berechnung des Korrelationskoeffizienten (Abschn. 6.2.2) bzw. durch lineare Regression (Abschn. 6.2.3) untersucht. Im Vorfeld solcher Auswertungen sollten auf jeden Fall bivariate grafische Darstellungen betrachtet werden. Im Abschn. 6.2.1 wird veranschaulicht, wie diese Grafiken in SAS Studio erzeugt werden können.

Gisela Büchele, Martin Rehm, Rainer Muche

7. Statistische Tests für unabhängige Beobachtungen

Zusammenfassung

Unterteilt werden die Testverfahren in diesem Buch danach, ob unabhängige oder abhängige Daten ausgewertet werden sollen. Voraussetzung für die in diesem Kapitel beschriebenen Tests ist also die Unabhängigkeit der Daten, d. h., dass die zu vergleichenden Beobachtungen von unterschiedlichen Patienten oder Probanden stammen. Im Abschn. 7.1 werden Tests angegeben, mit denen die Unabhängigkeit zweier qualitativer bzw. diskreter Variablen untersucht werden können. Für den Vergleich von stetigen Variablen unabhängiger Gruppen gibt es einmal Tests, die darauf basieren, dass diese Messwerte zumindest annähernd normalverteilt sind. Im Abschn. 7.2.1 werden solche Tests für den Mittelwertunterschied zwischen zwei Gruppen (Abschn. 7.2.1.1) und mehr als zwei Gruppen (Abschn. 7.2.1.2) angegeben. Sollte nicht klar sein, ob die Verteilung der Messwerte einer Normalverteilung entspricht, können Tests für nicht-normalverteilte Messwerte aus dem Abschn. 7.2.2 angewendet werden.

Gisela Büchele, Martin Rehm, Rainer Muche

8. Statistische Tests für abhängige Beobachtungen

Zusammenfassung

Auf Vorbemerkungen allgemeiner Art kann in diesem Kapitel weitgehend verzichtet werden. Diese finden sich hauptsächlich im Kap. 4: Einführung in statistische Tests, Voraussetzung der Normalverteilung, Bemerkungen zu nichtparametrischen Verfahren (Abschn. 4.5) und Unterscheidung von unabhängigen und abhängigen Daten (Abschn. 4.6). Voraussetzung für die folgenden Tests ist die Abhängigkeit der Daten, d. h. dass die zu vergleichenden Beobachtungen jeweils von derselben Untersuchungseinheit (in der Medizin meist ein Patient) stammen. Für den Vergleich von zwei qualitativen bzw. diskreten abhängigen Merkmalen wird im Abschn. 8.1 der McNemar-Test vorgestellt. Für den Vergleich von stetigen abhängigen Variablen gibt es den t-Test für gepaarte Stichproben, sofern Normalverteilung für die zu untersuchenden Variablen vorausgesetzt werden kann (Abschn. 8.2.1). Kann nicht von Normalverteilung ausgegangen werden, gibt es für die Untersuchung derselben Situation den Wilcoxon-Test für Wertepaare (Abschn. 8.2.2).

Gisela Büchele, Martin Rehm, Rainer Muche

9. Einstichprobentests und Konfidenzintervalle

Zusammenfassung

In diesem Kapitel werden zwei statistische Konzepte vorgestellt. Das sind einmal die Einstichprobentests, mit denen statistische Kenngrößen einer Variablen mit vorgegebenen Werten (z. B. aus der Literatur) verglichen werden können. Solche Tests sind z. B. in der Qualitätskontrolle wichtig, in der Stichprobenwerte mit Angaben des Herstellers verglichen werden müssen. Auch in der Klinischen Chemie im Labor sind in Ringversuchen Messwerte mit einem vorgegebenen Wert einer Standardprobe zu vergleichen. SAS Studio ermöglicht solche Vergleiche für Anteile und Proportionen als Kenngröße qualitativer bzw. diskreter Variablen (Abschn. 9.1) sowie für Mittelwerte bei stetigen normalverteilten Variablen (Abschn. 9.2). Außerdem gibt es einen Einstichprobentest für Varianzen, der hier aber nicht erläutert wird. Daneben lassen sich auch Konfidenzintervalle (s. Abschn. 4.5) für diese statistischen Kenngrößen (Proportion, Mittelwert, Varianz) berechnen. Entsprechend der Einstichprobentests findet man ein Konfidenzintervall für eine Proportion im Abschn. 9.1 und ein Konfidenzintervall für einen Mittelwert im Abschn. 9.2.

Gisela Büchele, Martin Rehm, Rainer Muche

10. Überlebenszeitanalyse

Zusammenfassung

In diesem Kapitel geht es um grundlegende Methoden der Überlebenszeitanalyse und zwar um die Kaplan-Meier-Überlebenskurven und -Wahrscheinlichkeiten sowie den Log-Rank-Test (für eine kurze Einführung siehe Abschn. 4.8). Im Abschn. 10.2 werden die Überlebenswahrscheinlichkeiten nach der Methode von Kaplan-Meier geschätzt und grafisch dargestellt. Des Weiteren wird in Abschn. 10.3 aufgezeigt, wie Konfidenzbereiche für den Kaplan-Meier-Schätzer und die Kaplan-Meier-Kurve ausgegeben werden können. Für den Vergleich der Überlebenszeiten von unabhängigen Gruppen kann der Log-Rank-Test eingesetzt werden. Im Abschn. 10.4 soll an einem Beispiel gezeigt werden, ob sich die Zeiten bis zum Auftreten eines Ereignisses bei zwei Patientengruppen unterscheiden. Da diese Auswertungen eine besondere Datenstruktur voraussetzen, werden die nötigen Datentransformationen in einem eigenen Kapitel (Abschn. 10.1) vorangestellt, falls der Datensatz nicht schon direkt eine Überlebensvariable (Abschn. 10.1.2–10.1.3) mit zugehöriger Zensierungsvariable (Abschn. 10.1.1) enthält.

Gisela Büchele, Martin Rehm, Rainer Muche

11. Fallzahlberechnungen

Zusammenfassung

Die Notwendigkeit von Fallzahlberechnungen ist in Abschn. 4.9 dargestellt. In diesem Kapitel werden drei Fallzahlberechnungen vorgestellt. Diese sind der t-Test für unabhängige Stichproben (Abschn. 11.1), der t-Test für gepaarte Stichproben (Abschn. 11.2) und der χ²–Test für Proportionen (Abschn. 11.3).

Gisela Büchele, Martin Rehm, Rainer Muche

Backmatter

Titel: Medizinische Statistik mit SAS Studio unter SODA
verfasst von: Dr. Gisela Büchele
Martin Rehm
Prof. Dr. Rainer Muche
Copyright-Jahr: 2019
Verlag: Springer Berlin Heidelberg
Electronic ISBN: 978-3-662-59283-0
Print ISBN: 978-3-662-59282-3
DOI: https://doi.org/10.1007/978-3-662-59283-0