PHÂN PHỐI CHI BÌNH PHƯƠNG - Fukushima Medical University

Transcription

PHÂN PHỐI CHI-BÌNH PHƯƠNG&XỬ LÝ CÁC TẦN SỐNguyễn Quang Vinh – Nguyễn Thị Từ Vân

CHI-BÌNH PHƯƠNG2( )Karl Pearson (1857-1936) Một trong những phân phối được sử dụng rộng rãinhất Kiểm định giả thuyết khi dữ liệu ở dạng tần số: kiểmsự khác nhau giữa các tỷ lệ Phù hợp nhất với các biến số ở dạng phân nhóm /phân loại

N(μ,σ)phân phối bìnhN(0,1):N (chuyển , thành) transformed tothườngN( 0 ,chuẩn1 ) by:2z x x 22z a phốidistribution followsz có phânχ2, với: with 1,or::độ tự dfdo df1, hay22z χ22(1)

x1 μ x2 μ 22χ z1 z2 σ σ 22followsa distribution withcó phân phối χ với độtự dodfdf 22222(2)InNóigeneralchung::χ2(n) z z . z21222nfollows distribution tựwithcó phâna phốiχ2 với độdodfdf n2

Côngthứcphối on :Themathematicalcủaform phânof the χ distributi2χ:2f (u ) 11u k / 2 1e u / 2 k 2 1 ! 2 với: e 2.71828 , k dfwherek/2,u 0

ỨNG DỤNG CỦA 2 Tần số quan sát (Thấy/Thực tế)so vớiTần số kỳ vọng (Nghĩ/Giả thuyết) (1) Kiểm định tính phù hợp (mức độ khớp)(2) Kiểm định tính độc lập(3) Kiểm định tính thuần nhất

2 kiểm định tính phù hợp Phép kiểm 2 đuôi cho tỷ lệ 2 biến cố:HO: p p0HA: p p0 Nhiều biến cố:HO: p1 p10, p2 p20, , pk pk0HA: ít nhất có một tỷ lệ pi không phù hợp

22 χ kiểmtính phùtest ofđịnhgoodness ofhợp fitTrịsố:statistic :Test(O E ) EĐộtự do số loại1df numberof -categories-122c22rejecttừbỏ HH0 nếuo if cc 22 ,α,dfdf

2 kiểm định tính phù hợp Mức độ phù hợp (khớp) của sự phân bố dữ liệu cóđược so với một phân phối lý thuyết* Tần số kỳ vọng nhỏ: 5- Kết hợp các nhóm kế cận để đạt được số tốithiểu.*Kolmogorov-Smirnov kiểm các phân phối liên tục

2 kiểm định tính độc lập Phép kiểm 2 được dùng nhiều nhất Một tổng thể, khi mỗi cá thể được phân loại theo 2tiêu chuẩn:Tiêu chuẩn thứ 1: hàngTiêu chuẩn thứ 2: cột Bảng phân loại theo 2 tiêu chẩn: r hàng, c cột HO: 2 tiêu chuẩn phân loại độc lập với nhau (khôngcó liên quan)HA: 2 tiêu chuẩn phân loại không độc lập với nhau(có liên quan) df (r – 1 )(c – 1)

2 kiểm định tính độc lậpTần số kỳ vọng nhỏ Không nên dùng phép kiểm 2 testnếu có bất kỳ Ei 5

2 kiểm định tính thuần nhấtĐể xác định xem các nhóm riêng biệtcó thể được xem là cùng thuộc mộttổng thể.

22 kiểm định tính thuần kiểm định tính độc lậpnhất Tổng số ở hàng và cộtkhông bị kiểm soát bởingười làm nghiên cứu Tổng số ở hàng hay cộtbị kiểm soát bởi ngườilàm nghiên cứu ? có sự liên quan (2 tiêuchuẩn) ? có đồng nhất (các mẫunghiên cứu có phải từmột tổng thể)cách tính toán như nhau nhưng ý niệm khác nhau

PHÉP KIỂM CHÍNH XÁCFISHER

Điều trịChứngTổngO xK–xKO-n–x(N-K)-(n-x)N-KTổngnN-nN KN N Kx nn-x C x .N K C n xP( x) N CnK

Chúng ta có kết quả của thực nghiệm nhưsau:Điều trịChứngTổngO 617O-246Tổng8513

Liệt kê tất cả các tình huống có thể cótrong một cỡ mẫu 13, có được: 7 kết cục tốt & 8 đối tượng trong nhóm điều trị.Chúng ta có 6 bảng sau:

Điều trịChứngTổngO 707C 7 .6 C 1P(x 7 ) 13 C 8O-156 Tổng8513Điều trịChứng76 .00471287TổngO 617O-246Tổng8513C6 .6 C 2P(x 6 ) 13 C 87 .0816

Điều trịChứngTổngO 527O-336Tổng8513Điều trịChứngTổngO 437O-426Tổng8513C5.6 C 3P(x 5 ) 13 C 87 .3262C4 .6 C 4P(x 4 ) 13 C 87 .4070

Điều trịChứngTổngO 347O-516Tổng8513Điều trịChứngTổngO 257O-606Tổng8513*Kiểm lại: cộng tất cả các xác suất 1 (có làm tròn số)C3.6 C 5P(x 3 ) 13 C 87 .1632C2 .6 C 6P(x 2 ) 13 C 87 .0163

ProbabilityPhân phối Distributionxác suất0.50.4P(x)20.330.2450.1601x7

Giả thuyết HO: T C(không có sự khác biệt giữa 2 nhóm: điều trị và chứng) HA: T C (1-đuôi)hay,HA: T C (2-đuôi)

Tính giá trị P Xác suất để có bộ dữ liệu nghiên cứu là 0.0816 Giá trị P là xác suất để có bộ dữ liệu, hay hơnnữa (tốt hơn/xấu hơn).Giá trị P một đuôi:P(x 6) P(x 6) P(x 7) 0.0816 0.0047 0.0863

Tính giá trị PGiá trị P hai đuôi:(1) P(x 6 hay x 2) P(x 2) P(x 6) P(x 7) 0.0816 0.0047 0.0163 0.1026(2) Nhân đôi kết quả một đuôi*, thành:P 2x0.0863 0.1726*tính xấp xỉ

CHI-BÌNH PHƯƠNG ( 2) Một trong những phân phối được sử dụng rộng rãi nhất Kiểm định giả thuyết khi dữ liệu ở dạng tần số: kiểm sự khác nhau giữa các tỷ lệ Phù hợp nhất với các biến số ở dạng phân nhóm / phân loại Karl Pearson (1857-1936)