Nichtparametrische Varianzanalysen - Praktische Anwendung

Transcription

Nichtparametrische Varianzanalysen - praktische AnwendungNichtparametrische Varianzanalysen sind primär anzuwenden, wenn die abhängige Variableentweder metrisch ist und die Voraussetzungen „Normalverteilung der Residuen“ sowie „Varianzhomogenität“ nicht gegeben sind, oder aber wenn die abhängige Variable ordinalesSkalenniveau hat. Die hier besprochenen Verfahren des Kruskal-Wallis- H-Test und derFriedman-Varianzanalyse bzw. der Verallgemeinerungen von Puri & Sen (vgl. dazu Shirley,E.A. : A distribution-free method for analysis of covariance based on ranked data, 1981, J. ofApplied Statistics 30: 158-162, Bennett, B.M. Rank-order tests of linear hypotheses, 1968 , J.of Stat . Society B 30: 483-489 und Winer, B.J. et.al.: Statistical Principles in Experimental Design, 1991, S. 1024 ff) sowie Bredenkamp (vgl. dazu G.A.Lienert: Verteilungsfreie Methodenin der Biostatistik - Band 2, 1987, S. 1086 ff) setzen zwar metrisches Skalenniveau voraus, sindaber in allen gängigen Statistikprogrammen, insbesondere SPSS, so implementiert, dassBindungen (gleiche Werte der abhängigen Variablen) berücksichtigt werden und damit aufordinale Variablen anwendbar sind. Zum Teil sind allerdings zusätzliche kleine Rechnungenmit dem Taschenrechner erfordrelich.Darüber hinaus gibt es noch Methoden für nominale, insbesondere dichotome abhängige Variablen. Letztere werden weiter unten behandelt. Varianzanalytische Fragestellungen mit einerpolychotomen abhängigen Variablen werden über Kontingenztabellenanalyse, insbesonderemittels der Analyse loglinearer Modelle gelöst.1. Unabhängige Stichproben: 1-faktoriellGetestet wird - wie bei der klassischen Varianzanalyse - die Hypothese gleicher Gruppenmittelwerte: 1 2 kDies erfolgt über den Kruskal-Wallis-H-Test, einer Verallgemeinerung des Mann-Whitney-UTests von 2 auf beliebig viele Gruppen. Für den Test wird ein Wert H errechnet, der 2-verteiltist mit (k-1) Freiheitsgraden.Derselbe Test lässt sich auch über eine einfaktorielle klassische Varianzanalyse durchführen.Dies wird in Abschnitt 2.3 ausführlich beschrieben.2. Unabhängige Stichproben: 2-faktoriellHier muss unterschieden werden zwischen balancierten und nichtbalancierten Versuchsplänenbzw. Zellenbesetzungszahlen. Bei balancierten Versuchsplänen sind die Zellenbestzungszahlenzeilenweise oder spaltenweise proportional zueinander, z.B. bei einem Versuchsplan mit denFaktoren A (4 Stufen) und B (3 Stufen)B1B2B3A1101216A2151824A3202432A4101216In diesem Beispiel sind die Zellenbesetzungszahlen der 2. bzw. 3. Spalte das 1,2-fache bzw 1,6-

fache der 1. Spalte. Umgekehrt kann man auch erkennen, dass die Zellenbesetzungszahlen der2. bzw. 3. Zeile das 1,5-fache bzw. das 2-fache der ersten Zeile sind.Versuchspläne mit gleichen Zellenbesetzungszahlen sind natürlich immer balanciert.2.1 Anmerkungen zur 2-faktoriellen VarianzanalyseSoll der Einfluss zweier Einflussfaktoren A und B auf eine abhängige Variable x untersuchtwerden, so bringen zwei 1-faktorielle Varianzanalysen der Faktoren A und B nur die halbeWahrheit hervor, mitunter sogar irreführende Ergebnisse. Neben den sog. Haupteffekten derFaktoren A und B gibt es einen sog. Interaktionseffekt A*B. Dieser zeigt an, ob der Einfluss vonA von B abhängig ist, und umgekehrt, ob der Einfluss von B von A abhängig ist. So kann esdurchaus vorkommen, dass die Haupteffekte A und B nicht signifikant sind, dafür aber A*B.Dies besagt, dass ein Einfluss von A vorhanden ist, der je nach Gruppe (Stufe) des Faktors Bunterschiedlich ausfällt, und umgekehrt, dass ein Einfluss von B vorhanden ist, der je nachGruppe (Stufe) des Faktors A unterschiedlich ausfällt.Dies lässt sich grafisch durch einen sog. Interaktionsplot (in SPSS Profilplot genannt) veranschaulichen, in SPSS erhältlich über die parametrische Varianzanalyse (Analysieren - Allg.lineare Modell - univariat - Diagramme). Dort werden Mittelwertlinien des Faktors Agetrennt für die Stufen des Faktors B gezeichnet. Ein nicht paralleler Verlauf der Kurven deutetauf eine signifikante Interaktion hin. Dies kann zum einen sein: Der Einfluss von A ist unterschiedlich stark für die Gruppen von B, oder der Einfluss von A ist für die Gruppen von Bgegensätzlich.Interaktionsplot für den Datensatz von S. 425 aus dem Buch von B.J.Winer

2.2 Verfahren bei balancierten Versuchsplänen:Nach Bredenkamp wird zum Test der beiden Haupteffekte (A und B mit k bzw. l Stufen) jeweilsder Kruskal-Wallis-H-Test durchgeführt (Ergebnisse: 2A und 2B). Zum Test der InteraktionA*B wird ein H-Test zum Vergleich aller Zellen durchgeführt (Ergebnis: 2AB), von dem erhaltenen 2-Wert dann die 2-Werte der Haupteffekte abgezogen und schließlich der Restwertanhand der Tabelle der 2-Verteilung auf Signifikanz überprüft:H-Testwerte ( 2-Werte)Freiheitsgrade 2ABkl-1 2A 2Bk-1- 2AB - 2A - 2Bl-1(k-1)(l-1)2.3 Verfahren bei beliebigen, insbesondere nichtbalancierten Versuchsplänen:Allgemein kann die nichtparametrische Varianzanalyse auf die klassische parametrische Varianzanalyse zurückgeführt werden, indem die abhängige Variable zuvor in Ränge transformiertwird, für diese dann die Varianzanalyse durchgeführt wird und anschließend anstatt der F-Tests 2-Tests durchgeführt werden (vgl. die o.a. Quellen: Winer, B.J. et.al. sowie Shirley, E.A.).Dabei werden die 2-Werte errechnet alsSS Effekt2 -----------------MS totalwobei SSEffekt die Streuungsquadratsumme (Sum of Squares) des zu testenden Effektes (A, Boder A*B) und MStotal die Gesamtvarianz, in SPSS korrigierte Gesamtvariation, (MeanSquare) ist, die beide aus der Anova-Tabelle abgelesen werden können. (Im balancierten Fallsind diese 2-Werte identisch mit denen, die über die o.a. erste Methode errechnet werdenkönnen.) Die 2-Werte sind dann in den Tafeln für den 2-Test auf Signifikanz zu überprüfen,wobei die Freiheitsgrade die Zählerfreiheitsgrade des entsprechenden F-Tests sind.2.4 Beispielrechnung für den Datensatz von S. 425 aus dem Buch von B.J.Winer: Verfahren von Bredenkamp:(Durchnummerierung der Zellen: (Patients - 1)*#Drugs Drugs ) 2Patients 0,872 (1 Fg.) 2Drugs 2,326 (2 Fg.) 2Zellen 11,755 (5 Fg.) 2Interaktion 11,755 - 0,872 - 2,326 8,557 (2 Fg.)(Der kritische 2-Wert für 2 Fg. und 0.05 beträgt 6.) Verfahren von Puri & Sen bzw. Winer:Die Varianzanalysetabelle für die rangtransformierten Daten

Tests der es Modellvom Typ III330,167Konstanter Termpatientsdrugpatients * drugFehlerGesamtKorrigierte 102,000477,500Mittel 000,183,111,003Daraus ergeben sich:MS total 477,5 / 17 28,09 2Patients 24,50 / 28,09 0,872 2Drugs 65,33 / 28,09 2,326 2Interaktion 240,33 / 28,09 8,5563. Unabhängige Stichproben: mehrfaktoriellDie beiden o.a. Verfahren lasssen sich trivialerweise auch auf Versuchspläne mit mehr als zweiFaktoren anwenden.4. Abhängige Stichproben: 1-faktoriellAuch hier wird - wie bei der klassischen Varianzanalyse - die Hypothese gleicher Gruppenmittelwerte getestet: 1 2 kDies erfolgt bei abhängigen Stichproben, also Messwiederholungen, über den Friedman-Test,einer Verallgemeinerung des Wilcoxon-Tests von 2 auf beliebig viele Messwiederholungen. Fürden Test wird ein Wert errechnet, der 2-verteilt ist mit (k-1) Freiheitsgraden.Derselbe Test lässt sich auch über eine einfaktorielle klassische Varianzanalyse durchführen.Dies wird in Abschnitt 5.2 ausführlich beschrieben.5. Abhängige Stichproben: Messwiederholungen auf 2 FaktorenAusgangsbasis sind Messwiederholungen einer Variablen, die hinsichtlich zweier Faktorenstrukturiert sind, z.B. Stressempfinden vor einem Trainingsprogramm, nach einem und nach 3Monaten, sowie jeweils morgens und abends. Da zu allen Zeitpunkten an denselben Personenbzw. Erhebungseinheiten die Werte ermittelt wurden, entfällt hier eine Unterscheidung hinsichtlich balancierter Versuchspläne.5.1 Verfahren von BredenkampNach der Methode von Bredenkamp wird zum Test der beiden Haupteffekte (A und B mit kbzw. l Stufen) jeweils ein Friedman-Test durchgeführt. Und zwar werden beim Test für Ajeweils alle Werte zu A1, alle Werte zu A2 usw summiert und auf die Summen der FriedmanTest angewandt. Analog beim Test für B (Ergebnisse: 2A und 2B). Zum Test der Interaktion

A*B wird ein Friedman-Test über alle Messwiederholungen durchgeführt (Ergebnis: 2AB),von dem erhaltenen 2-Wert dann die 2-Werte der Haupteffekte abgezogen und schließlich derRestwert anhand der Tabelle der 2-Verteilung auf Signifikanz überprüft. Dieses Verfahren verläuft also analog dem oben besprochenen für unabhängige Stichproben. Leider hat sich gezeigt,dass die Berechnung der Interaktion auf diese Weise nicht korrekt ist, so dass davon abgeratenwerden muss.5.2 Verfahren von Winer und ShirleyBesser lassen sich die Ergebnisse über eine Rangtransformation, anschließende klassische Varianzanalyse und Konstruktion von 2-Tests erzielen (vgl. dazu o.a. Quelle: Winer, B.J. et.al.).Hierzu müssen die Variablen der Messwiederholungen in Ränge transformiert werden. DaSPSS keine fallweise Rangberechnung über mehrere Variablen erlaubt, sind einige Schrittedazu erforderlich (die in einem separaten Skript ausführlich beschrieben sind): 1. Über „Daten- Umstrukturieren - Transponieren“ müssen die gewünschten Variablen in Fälle gewandeltwerden. 2. Die aus den Fällen neu entstandenen Variablen werden über „Transponieren - Rangfolge bilden“ in Ränge umgerechnet. 3. Die neu entstandenen Rangvariablen müssenwieder wie oben transponiert werden. Auf diese Weise hat man die Variablen der Messwiederholungen in Ränge transformiert. Darauf wird nun die klassische Varianzanalyse mit Messwiederholungen angewandt. Die 2-Tests für die Haupteffekte und die Interaktion werden wiefolgt errechnet:SS Effekt2 ------------------------------------------------- SS Effekt SS Fehler df Effekt df Fehler wobei SSEffekt die Streuungsquadratsumme (Sum of Squares) des zu testenden Effektes (A, Boder A*B), SSFehler die Streuungsquadratsumme des zum Effekt gehörenden Fehlers ist sowiedf die entsprechenden Freiheitsgrade. Die 2-Werte sind dann in den Tafeln für den 2-Test aufSignifikanz zu überprüfen, wobei die Freiheitsgrade die Zählerfreiheitsgrade (dfEffekt) des entsprechenden F-Tests sind.5.3 Beispielrechnung für den Datensatz von S. 537 aus dem Buch von B.J.Winer: Verfahren von Bredenkamp:Berechnung der Summen:compute time1 mean(v1,v2,v3).compute time2 mean(v4,v5,v6).compute time3 mean(v7,v8,v9).compute dial1 mean(v1,v4,v7).compute dial2 mean(v2,v5,v8).compute dial3 mean(v3,v6,v9). 2time 12,0 (2 Fg.) 2dials 12,0 (2 Fg.) 2Zellen 43,76 (8 Fg.) 2Interaktion 43,76 - 12,0 - 12,0 19,76 (4 Fg.)(Der kritische 2-Wert für 4 Fg. und 0.05 beträgt 9,5.) Verfahren von Winer:Die Varianzanalysetabelle für die rangtransformierten Daten

Tests der me)DialsFehler(Dials)Time * DialsFehler(T*D)Sphärizität Sphärizität Sphärizität Sphärizität Sphärizität Sphärizität vom Typ 0003,2223,2223,2223,2228,7788,7788,7788,778Mittel 98,162,233Daraus ergeben sich:SSTime 185 (2 Fg.)FehlerTime 9,97 (10 Gf.)SSDials 139 (2Fg.)FehlerDials 13 (10Fg.)SSInteraktion 3,22 (4 Fg.)FehlerInteraktion 8,8 (20 Fg.) 2Time 185 / (185 9,97)/(2 10) 11,39 2Dials 139 / (138 13)/(2 10) 10,97 2Interaktion 3,22 / (3,22 8,8)/(4 20) 6,446. Abhängige Stichproben: Messwiederholungen auf 1 FaktorHier wird ausgegangen von einem 2-faktoriellen Versuchsplan: ein Gruppierungsfaktor A(unabhängige Stichproben) und einem Messwiederholungsfaktor B (abhängige Stichproben).6.1 Verfahren von BredenkampNach dem Verfahren von Bredenkamp wird zum Test des Haupteffekts A pro Erhebungseinheit(z.B. Versuchsperson) die Summe aller Messwiederholungen errechnet. Hierauf wird dann dero.a. Kruskal-Wallis-H-Test angewandt. Zum Test des Haupteffekts B wird ein Friedman-Testüber die Messwiederholungen durchgeführt, wobei die Gruppeneinteilung durch den Faktor Aignoriert wird. Für die Interaktion wird für jede Stufe des Faktors A ein Friedman-Test errechnet, die resultierende 2-Werte aufsummiert, davon der 2-Wert des Friedman-Tests desHaupteffekts B abgezogen und schließlich der Restwert anhand der Tabelle der 2-Verteilung

auf Signifikanz überprüft. 2-TestwerteFreiheitsgrade 2B (A1)l-1 2B (A2)l-1 . 2B (Ak)- 2B Summe( 2B (Ai)) - 2Bl-1l-1(k-1)(l-1)6.2 Verfahren von Winer und ShirleyAuch hier lassen sich die Ergebnisse über eine Rangtransformation, anschließende klassischeVarianzanalyse und Konstruktion von 2-Tests erzielen. Allerdings ist die Umrechnung derRohwerte in Ränge etwas komplizierter. Die Schritte im Einzelnen: pro Erhebungseinheit (z.B. Versuchsperson) die Summe S aller Messwiederholungen errechnen; S in Ränge RS umrechnen; in SPSS müssen an dieser Stelle die Daten wie in 5. umstrukturiert werden, was in einemseparaten Skript ausführlich beschrieben ist; pro Erhebungseinheit (z.B. Versuchsperson) die Rohwerte xi in Ränge Ri umrechnen; die endgültigen Ränge errechnen sich als (RS-1)*l Ri , wobei l die Anzahl de

der Kruskal-Wallis-H-Test durchgeführt (Ergebnisse: . SPSS keine fallweise Rangberechnung über mehrere Variablen erlaubt, sind einige Schritte dazu erforderlich (die in eine m separaten Skript ausführlich be schrieben sind): 1. Über „Daten - Umstrukturieren - Transponieren“ müssen die gewünschten Variablen in Fälle gewandelt werden. 2. Die aus den Fällen neu entstandenen .File Size: 332KBPage Count: 10