Μη ΠαραµετρικοίΈλεγχοι - Auth

Transcription

Μη Παραµετρικοί ΈλεγχοιΕπιστηµονική Επιµέλεια: ρ. Γεώργιος ΜενεξέςΤοµέας Φυτών Μεγάλης Καλλιέργειαςκαι ΟικολογίαςΕργαστήριο ΓεωργίαςViola adorata

Καταρχήν

Μη Παραµετρικοί Έλεγχοι εν απαιτούν κανονικότητα στις κατανοµές τωνµεταβλητών.Η κλίµακα µέτρησης των µεταβλητών πρέπει ναείναι τουλάχιστον διάταξης (ordinal).Μπορούν να εφαρµοστούν όταν τα δείγµαταείναι µικρά. εν απαιτούνται εκτιµήσεις των παραµέτρωντων κατανοµών.Εφαρµόζονται στις περιπτώσεις που δενµπορούν να εφαρµοστούν έλεγχοι τηςΠαραµετρικής Στατιστικής.

Παραδείγµατα Ελέγχων

Έλεγχος Kruskal-Wallis (1)Ο έλεγχος Kruskal-Wallis είναι Μη Παραµετρικήδιαδικασία που µπορεί να εφαρµοστεί για τησύγκριση τριών ή περισσότερων πληθυσµών.Πιο συγκεκριµένα:Ηο: Τα k δείγµατα προέρχονται από τον ίδιοπληθυσµό.Η1: Τουλάχιστον ένα δείγµα προέρχεται απόδιαφορετικό πληθυσµό.σε ε.σ. α

Έλεγχος Kruskal-Wallis (2) Αν η µηδενική υπόθεση απορριφθεί τότετουλάχιστον δύο πληθυσµοί διαφέρουνστατιστικά σηµαντικά ως προς τη διάµεσητιµή τους (και µε χαλαρή ερµηνεία ωςπρος τους αντίστοιχους µέσους όρους).

Προεργασία (1) Τα k δείγµατα-οµάδες ενοποιούνται σε ένα µεγάλοδείγµα-οµάδα µεγέθους n, n n1 n2 nkΓια κάθε µία από τις n ειςυπολογίζεται η βαθµίδα της (τάξη ή σειρά κατάταξηςrank). ηλαδή, στις αρχικές µετρήσεις αποδίδονταιβαθµοί από το 1 µέχρι το n. Το 1 αποδίδεται στηµέτρηση-τιµή-παρατήρηση µε τη µικρότερη αριθµητικήτιµή. Σε περίπτωση ισοπαλίας-δεσµού (tie) αποδίδεται οµέσος όρος των αρχικών βαθµίδων. Υπάρχει καιδιορθωµένη εκδοχή του ελέγχου σε περίπτωσηισοπαλιών.Για κάθε δείγµα-οµάδα υπολογίζεται το άθροισµα Τi τωνβαθµίδων των αντίστοιχων �ν.

Ισοπαλίες- εσµοί (1) Όταν η µεταβλητή που εξετάζεται έχειπολλαπλές τιµές. ηλαδή, ορισµένες τιµές τηςεπαναλαµβάνονται δύο ή περισσότερες φορές. Καταγράφουµε: Το πλήθος των πολλαπλών τιµών (π.χ. 10 από τις100 τιµές επαναλαµβάνονται δύο ή περισσότερεςφορές). Την πολλαπλότητα ρ (πόσες φορές εµφανίζεται) τηςκάθε πολλαπλής τιµής (π.χ. αν η τιµή 38 έχειπολλαπλότητα 4, εµφανίζεται 4 φορές ή 4 τιµές τηςεξεταζόµενης µεταβλητής είναι ίσες µε 38).

Ισοπαλίες- εσµοί (2)35512,5 2,51012? ?a?µat ? t ?µ?45? a?µ?de?2 ?a?3 ? ?s ?ßa?µ?a (?s ?p a?a, des µ?)

Παράδειγµα ανάθεσης βαθµίδας(χωρίς ισοπαλίες-δεσµούς)

Παράδειγµα ανάθεσης βαθµίδας(µε ισοπαλίες-δεσµούς)Υπάρχουν 3πολλαπλές τιµές:η 3090 µεπολλαπλότητα 2,η 4312 µεπολλαπλότητα 3και η 3850 µεπολλαπλότητα 2

ιαδικασία Υπολογίζεται το στατιστικό:Ti 212H 3(n 1)n(n 1) ni Κάτω από την ορθότητα της µηδενικήςυπόθεσης το στατιστικό H ακολουθείπροσεγγιστικά Χ2 κατανοµή µε k-1 β.ε.Η µηδενική υπόθεση απορρίπτεται σε ε.σ.α 0,05 αν H Χ20,05 για k-1 β.ε. Η προσέγγισηείναι ικανοποιητική αν κάθε οµάδα-δείγµα έχειτουλάχιστον 5 ις.

Περιοχή Απόρριψης της Ηοα0ΑποδοχήΗοΑπόρριψηH02χ

ΠαράδειγµαΠεριοχή Αποδοχής της Η0Περιοχή Απόρριψης της Η0Κρίσιµή τιµήΤιµή είγµατος

Προϋποθέσεις Εφαρµογής είγµατα τυχαία Παρατηρήσεις ανεξάρτητες Κλίµακα µέτρησης της µεταβλητήςτουλάχιστον διάταξης (ordinal) Συµµετρικές κατανοµές µέσα σε κάθεοµάδα-δείγµα

Παρατηρήσεις (1)Αποτελεί τη Μη Παραµετρική εκδοχή τηςone-way ANOVA. Εφαρµόζεται σε Πλήρως ΤυχαιοποιηµέναΠειραµατικά Σχέδια. Eν γένει, έχει µικρότερη ισχύ (power) απότην Παραµετρική ANOVA. εν απαιτεί κανονικότητα στην κατανοµήτων µετρήσεων µέσα σε κάθε οµάδα.

Παρατηρήσεις (2) εν έχουµε εκτιµήσεις των παραµέτρων τωναντίστοιχων πληθυσµών.Χρησιµοποιεί λιγότερη πληροφορία από ότι ηΠαραµετρική ANOVA.Μπορεί να εφαρµοστεί σε περιπτώσεις που ταδείγµατα είναι µικρά σε µέγεθος.Η παρατηρούµενη στάθµη σηµαντικότητας τουελέγχου (p-value) µπορεί να υπολογιστεί είτε µετη µέθοδο Exact είτε µε τη µέθοδοπροσοµοίωσης Monte-Carlo (SPSS, Exact tests)

Παρατηρήσεις (3)Ο στατιστικός έλεγχος συχνά εµφανίζεταικαι ως:Ηο: Τ1 Τ2 ΤkH1: Τουλάχιστον δύο ιάµεσες Τιµές ( Τ)διαφέρουνσε ε.σ. α

Παράδειγµα Σε 4 ποικιλίες ενός φυτού µετρήθηκαν οιτιµές ενός αγρονοµικού χαρακτηριστικού.Τα στοιχεία δίνονται στον παρακάτωπίνακα. ιαφέρουν στατιστικά σηµαντικάοι 4 ποικιλίες σε ε.σ. α 0,05 ως προς τοαγρονοµικό χαρακτηριστικό;

Παράδειγµα (συνέχεια)Πίνακας 8079816288

Παράδειγµα (συνέχεια)Βοηθητικοί ΥπολογισµοίTiΠ1Π2Π3Π465(3) 75(7) 59 (1) 94 (16)87 (13) 69(5) 78 (8) 89 (15)73(6) 83 (12) 67 (4) 80 (10)79(9) 81 (11) 62 (2) 88 (14)31351555

Παράδειγµα (συνέχεια)Ti 212H 3(n 1)n(n 1) ni12 312 352 152 552 3(17) 8,9616(17) 4 Η κρίσιµη της Χ2 κατανοµής σε ε.σ. α 0,05 για4-1 3 β.ε. είναι 7,81. Απόφαση:8,96 7,81 Απορρίπτεται η Ηο. Συµπέρασµα: Υπάρχουν στατιστικά σηµαντικέςδιαφορές µεταξύ των 4 ποικιλιών (τουλάχιστονδύο διαφέρουν).

Παράδειγµα (συνέχεια)

Παράδειγµα µε Ισοπαλίες- εσµούς(2 3)/23 οµάδες-δείγµατα (ΙΝ, CA και MD)Κατατάσσουµε τις µετρήσεις Χ σε αύξουσα σειράΑναθέτουµε βαθµίδες

ΣύνοψηΑντί του Ti ιόρθωσηγιαδεσµούς

Παράδειγµα µε το SPSSReport1Miles per GallonCountry of OriginAmericanEuropeanJapaneseTotal2Miles per 30,4523,55Median18,5526,5031,6023,00Std. ry of OriginAmericanEuropeanJapaneseTotalN2487079397Mean Rank148,10264,56300,70Αφού Sig. (p-value) 0,000 α 0,05η Μηδενική ΥπόθεσηΑπορρίπτεται. Συνεπώςτουλάχιστον δύο χώρες διαφέρουνστατιστικά σηµαντικά ως προς τηνκατανάλωση καυσίµου3Chi-SquaredfAsymp. Sig.Monte CarloSig.Test Statisticsb,cSig.99% ConfidenceIntervalLower BoundUpper BoundMiles perGallon133,7932,000,000a,000,000a. Based on 10000 sampled tables with starting seed2000000.b. Kruskal Wallis Testc. Grouping Variable: Country of Origin

Απορίες-Ερωτήσεις

Ο Συντελεστής Συσχέτισης των Τάξεων τουSpearman (1)

Ο Συντελεστής Συσχέτισης των Τάξεων τουSpearman (2)

Ο Συντελεστής Συσχέτισης των Τάξεων τουSpearman (3)

Ο Συντελεστής Συσχέτισης των Τάξεων τουSpearman (4)

Ο Συντελεστής Συσχέτισης των Τάξεων τουSpearman (5)

Παράδειγµα

Παράδειγµα (συνέχεια)

Παράδειγµα (συνέχεια)

Οπτικοποίηση της σχέσης (1)Πιθανό outlier

Οπτικοποίηση της σχέσης (2)Καµπύλη Loess (90%)

Παράδειγµα (συνέχεια)

Παράδειγµα (συνέχεια)

Παράδειγµα (συνέχεια)

Παράδειγµα (συνέχεια)

Παράδειγµα µε το SPSS (1) είκτης ΣυγκοµιδήςΕκατολιτρικό ΒάροςΣτάχυα m2Αρ. κόκκων / στάχυΒάρος 1000 κόκκωνyx1x2x3x4

Παράδειγµα µε το SPSS (2)Συντελεστές Συσχέτισης των Τάξεων SpearmanCorrelationsSpearman's rho είκτης ΣυγκοµιδήςΕκατολιτρικό βάροςΣτάχυα / m2Αριθµός κόκκων/στάχυΒάρος κόκκωνCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N ,449,07117,238,35817,022,93317**. Correlation is significant at the 0.01 level (2-tailed).Στατιστικά Σηµαντική Αρνητική Συσχέτισηp 0,003 a �Στάχυα / m2 022,93317,289,26017,228,37917-,375,138171,000.17

Παράδειγµα µε το SPSS �χυρήΣυσχέτισηΚαµπύλη Loess (90%)

Παράδειγµα µε το SPSS (4)Καµπύλη Loess (90%) εν φαίνεταινα υπάρχεισυσχέτιση(γραµµική ήτων τάξεων)

Παράδειγµα µε το SPSS (5)Συντελεστές Γραµµικής Συµµεταβολής PearsonCorrelations είκτης ΣυγκοµιδήςΕκατολιτρικό βάροςΣτάχυα / m2Αριθµός κόκκων/στάχυΒάρος κόκκωνPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N είκτηςΣυγκοµιδής1**. Correlation is significant at the 0.01 level �α / 82017,304,23617,223,38917-,380,13217117

Συσχέτιση είκτη Συγκοµιδής µε ταάλλα χαρακτηριστικά (n κατολιτρικό ΒάροςΣτάχυα m2Αρ. κόκκων / στάχυΒάρος 1000 κόκκωνP-valuesΣυντελεστής Συσχέτισης Spearman0,7500Spearmans' rp

Επισηµοποίηση

Προϋποθέσεις Εφαρµογής τουΕλέγχου Σηµαντικότητας είγµατα τυχαία Παρατηρήσεις ανεξάρτητες Κλίµακα µέτρησης της µεταβλητήςτουλάχιστον διάταξης (ordinal) Συµµετρικές κατανοµές µεταβλητών

Περιοχή Απόρριψης(δίπλευρος έλεγχος)

Παράδειγµα (n µικρό)Beef Rank Lamb 7134256774.579.866.974.194.4101.0110.03412567Σd2 14

Παράδειγµα (συνέχεια)α

Παράδειγµα (συνέχεια)6 drs 1 2n(n 1)6(14) 1 2 0.757(7 1)2

Παράδειγµα (συνέχεια)Από πίνακες (n 7) βρίσκουµε ότι ηκρίσιµη τιµή σε ε.σ. α 0,05 είναι 0,786. Η µηδενική υπόθεση δεν µπορεί νααπορριφθεί αφού 0,750 0,786. Σε επίπεδο σηµαντικότητας α 0,05 δενµπορούµε να ισχυριστούµε ότι υπάρχειστατιστικά σηµαντική συσχέτιση τωντάξεων µεταξύ των δύο µεταβλητών.

Απορίες-Ερωτήσεις

Αντιστοιχίες ΕλέγχωνΠαραµετρικοί Έλεγχοιt-test δείγµατα ανεξάρτηταt-test ζευγαρωτές παρατηρήσειςANOVA (one-way)Συντελεστής Γραµµικής Συµµεταβολής(Pearson)Μη Παραµετρικοί ΈλεγχοιMann-Whitney testWilcoxon testKruskal-Wallis testΣυντελεστής Συσχέτισης των Τάξεων(Spearman)

Μη Παραµετρικοί Έλεγχοι

Ποια είναι τα µειονεκτήµατατων Μη Παραµετρικώνελέγχων;

Βιβλιογραφία Φωτιάδης, Ν. (1995). Εισαγωγή στηΣτατιστική για Βιολογικές Επιστήµες.Θεσσαλονίκη: University Studio Press. Κολυβά,Φ. και Μπόρα-Σέντα, Ε.(1995). Στατιστική: ΘεωρίαΕφαρµογές. Θεσσαλονίκη: ΕκδόσειςΖΗΤΗ.

Έλεγχος Kruskal-Wallis (1) . Παράδειγµα µε το SPSS Report Miles per Gallon 10 39 20,13 18,55 6,377 248 16 44 27,89 26,50 6,724 70 18 47 30,45 31,60 6,090 79 10 47 23,55 23,00 7,792 397 Country of Origin American European Japanese Total Minimum Maximum Mean Median Std. Deviation N Ranks 248 148,10 70 264,56 79 300,70 397 Country of Origin American European Japanese Total .