Rất Hay: Bài 1. Quyết định về mức ý nghĩa của thống kê (p-value)

1. Quyết định mức ý nghĩa thống kê

Mục đích của suy luận thống kê và việc sử dụng các bài thống kê kiểm tra là để rút ra kết luận từ dữ liệu mẫu. Suy luận thống kê được sử dụng trong kiểm tra giả thuyết dựa trên lý thuyết xác suất. Kiểm tra ý nghĩa thống kê là kiểm tra của một giả thuyết vô hiệu, sức mạnh của các bằng chứng chống lại giả thuyết vô hiệu được đánh giá bằng cách sử dụng ý tưởng xác suất (cơ hội trong quá trình ra quyết định của chúng ta). Nói một cách đơn giản, kiểm tra ý nghĩa là phương pháp đánh giá sức mạnh chống lại giả thuyết vô hiệu và sức mạnh của bằng chứng này bởi những giá trị p thu được cho các bài thống kê kiểm tra.

Bất kỳ thống kê tham số cụ thể nào sẽ có một phân phối mẫu đã biết (chẳng như t-test, F-test và χ2) liên quan đến giả thuyết vô hiệu (H0), nó thường được lập thành bảng phân phối mẫu trong các sách thống kê. Khi một dữ liệu được phân tích và các kết quả đưa đến một giá trị thống kê kiểm tra cụ thể, và một xác suất quan sát liên quan, p. Xác suất quan sát này được so sánh với mức xác suất alpha được chọn trước, thường được gọi là mức ý nghĩa của một bài kiểm tra (thường là 5%, p≤0.05 hoặc 1%, p≤0.01).

Thông thường, nếu xác suất quan sát, p, là ≤ mức xác suất alpha đã chọn (xác suất mắc lỗi Loại I) thì giả thuyết vô hiệu bị bác bỏ và đạt được ý nghĩa thống kê. Sẽ tốt hơn nữa nếu các giá trị ước lượng và khoảng tin cậy của các tham số được báo cáo cùng giá trị p để tăng cường sức mạnh của các bằng chứng chống lại H0.

Vì quá trình suy luận chính thức là dựa trên sự phân phối mẫu của một thống kê đã chọn, nên cần có một mô hình thống kê hoặc xác suất cơ bản cho các bài kiểm tra thống kê. Ví dụ, phân phối xác suất chuẩn là một mô hình thống kê phổ biến mô tả phân phối xác suất của các biến và là mô hình xác suất cơ bản làm cơ sở cho một số thử nghiệm thống kê. Các phép thử thống kê có các suy luận dựa trên phân phối chuẩn được gọi là các thủ tục thống kê tham số (parametric statistical procedures).

Các suy luận sử dụng thủ tục thống kê tham số chỉ có thể hợp lệ khi đáp ứng bốn điều kiện:

các quan sát là độc lập;
chúng được lấy ngẫu nhiên từ một dân số;
chúng có các mức đo lường liên tục (ít nhất là trên lý thuyết);
và các sai số ngẫu nhiên liên quan đến các quan sát có một phân phối đã biết (thường là chuẩn).

Một số bài kiểm tra thống kê đòi hỏi đáp ứng các giả định bổ sung; những giả định này khác nhau về số lượng và mức độ. Ví dụ, trong số các thử nghiệm thống kê mạnh mẽ nhất là t-test và F-test. Kiểm tra t-test (để kiểm tra giả thuyết về sự khác biệt giữa hai trung bình mẫu), ngoài các giả định chung, còn giả định thêm điều kiện rằng dân số mà từ đó hai mẫu được rút ra phải có phương sai tương tự (phương sai đồng nhất).

2. Xử lý các vi phạm giả định thống kê

Chúng ta phải làm gì nếu các giả định chung của mô hình tham số và/hoặc các điều kiện cụ thể của các bài thử nghiệm thống kê cụ thể không được đáp ứng?

Trong trường hợp đầu tiên, chúng ta phải nhận biết khi nào các giả định kiểm tra bị vi phạm và nhận thức được mức độ nghiêm trọng của hậu quả của việc vi phạm các giả định cụ thể. Giả sử, nếu các giả định về phân phối cho một kiểm tra tham số không được đáp ứng thì chúng ta có thể sử dụng các bài kiểm tra phi tham số (Non-parametric). Những thử nghiệm này đôi khi được gọi là thử nghiệm phân phối tự do (distribution-free) vì chúng không đưa ra các giả định về phân phối xác suất của các sai số. Ví dụ, khi phân phối dân số cơ bản của một biến quan trọng được cho là không chuẩn hoặc khi các giả định đo lường không được đáp ứng, thì kiểm tra phi tham số nên được xem xét.

Các bài kiểm tra phi tham số thường kém về sức mạnh hơn so với các bài kiểm tra tham số tương đương (trung bình kém hơn về sức mạnh khoảng 10-20%). Một chiến lược thay thế để sử dụng các bài kiểm tra phi tham số là biến đổi dữ liệu để làm cho nó phân phối chuẩn hơn. Các thủ tục để kiểm tra tính chuẩn của phân phối dữ liệu và các biến chuyển đổi sẽ được thảo luận trong bài phân phối chuẩn.

Tài liệu tham khảo

Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

1. Quyết định mức ý nghĩa thống kê

2. Xử lý các vi phạm giả định thống kê

Tài liệu tham khảo

Related Posts

Cách dắt xe máy lùi: Hướng dẫn và kỹ năng cần thiết

Dây Bù Nhiệt Là Gì? Tất Tần Tật Những Thông Tin Bạn Cần Biết

Cách trị bọng mắt và quầng thâm tại nhà – Khám phá ngay!

Lollipop tiếng Anh là gì? Tất cả những gì bạn cần biết về kẹo mút này

Đột quỵ nên ăn gì – Tất cả những gì bạn cần biết để phục hồi sức khỏe sau đột quỵ

Liên nhục có tác dụng gì? Tìm hiểu về “thần dược” trong y học truyền thống Việt Nam