Cách tính giá trị p trong Excel

Lý thuyết đằng sau P-giá trị và giả thuyết vô hiệu thoạt đầu có vẻ phức tạp, nhưng hiểu được các khái niệm sẽ giúp bạn điều hướng thế giới thống kê. Thật không may, những thuật ngữ này thường bị sử dụng sai trong khoa học phổ biến, vì vậy sẽ rất hữu ích cho mọi người để hiểu những điều cơ bản.

Cách tính giá trị p trong Excel

Tính toán P-giá trị của một mô hình và việc chứng minh / bác bỏ giả thuyết không đơn giản một cách đáng ngạc nhiên với MS Excel. Có hai cách để thực hiện và chúng tôi sẽ đề cập đến cả hai cách. Nào cùng đào vào bên trong.

Giả thuyết Null và P-Giá trị

Giả thuyết vô hiệu là một tuyên bố, còn được gọi là một vị trí mặc định, khẳng định rằng mối quan hệ giữa các hiện tượng được quan sát là không tồn tại. Nó cũng có thể được áp dụng cho các liên kết giữa hai nhóm được quan sát. Trong quá trình nghiên cứu, bạn kiểm tra giả thuyết này và cố gắng bác bỏ nó.

Ví dụ: giả sử bạn muốn quan sát xem một chế độ ăn kiêng theo mốt cụ thể có mang lại kết quả đáng kể hay không. Trong trường hợp này, giả thuyết vô hiệu là không có sự khác biệt đáng kể về trọng lượng của đối tượng thử nghiệm trước và sau khi ăn kiêng. Giả thuyết thay thế là chế độ ăn đã tạo ra sự khác biệt. Đây là những gì các nhà nghiên cứu sẽ cố gắng chứng minh.

Các P-giá trị đại diện cho cơ hội mà tóm tắt thống kê sẽ bằng hoặc lớn hơn giá trị quan sát được khi giả thuyết rỗng là đúng đối với một mô hình thống kê nhất định. Mặc dù nó thường được biểu thị dưới dạng số thập phân, nhưng nói chung tốt hơn là diễn đạt nó dưới dạng phần trăm. Ví dụ, P-giá trị 0,1 phải được biểu thị bằng 10%.

Thấp P-value có nghĩa là bằng chứng chống lại giả thuyết vô hiệu là mạnh mẽ. Điều này hơn nữa có nghĩa là dữ liệu của bạn là quan trọng. Mặt khác, mức cao P-giá trị có nghĩa là không có bằng chứng chắc chắn chống lại giả thuyết. Để chứng minh rằng chế độ ăn kiêng hợp thời có hiệu quả, các nhà nghiên cứu sẽ cần phải tìm ra mức thấp P-giá trị.

Một kết quả có ý nghĩa thống kê là một kết quả rất khó xảy ra nếu giả thuyết vô hiệu là đúng. Mức ý nghĩa được biểu thị bằng chữ cái Hy Lạp alpha và nó phải lớn hơn P-giá trị cho kết quả có ý nghĩa thống kê.

Nhiều nhà nghiên cứu trong nhiều lĩnh vực sử dụng P-giá trị để có cái nhìn sâu sắc hơn và tốt hơn về dữ liệu mà họ đang làm việc. Một số lĩnh vực nổi bật bao gồm xã hội học, tư pháp hình sự, tâm lý học, tài chính và kinh tế.

Tìm kiếm P-Giá trị trong Excel

Bạn có thể tìm thấy P-giá trị của tập dữ liệu trong MS Excel thông qua chức năng T-Test hoặc sử dụng công cụ Phân tích Dữ liệu. Đầu tiên, chúng ta sẽ xem xét chức năng T-Test. Chúng tôi sẽ kiểm tra năm sinh viên đại học đã ăn kiêng trong 30 ngày. Chúng tôi sẽ so sánh cân nặng của họ trước và sau khi ăn kiêng.

LƯU Ý: Đối với mục đích của bài viết này, chúng tôi sẽ sử dụng MS Excel 2010. Mặc dù đây không phải là phiên bản mới nhất, nhưng các bước thường cũng nên áp dụng cho các phiên bản mới hơn.

Chức năng kiểm tra T

Thực hiện theo các bước sau để tính toán P-giá trị với chức năng T-Test.

  1. Tạo và điền bảng. Bảng của chúng tôi trông như thế này:
  2. Nhấp vào bất kỳ ô nào bên ngoài bảng của bạn.
  3. Nhập: = T.Test (.
  4. Sau dấu ngoặc mở, nhập đối số đầu tiên. Trong ví dụ này, đó là cột Trước khi ăn kiêng. Phạm vi phải là B2: B6. Cho đến nay, hàm trông giống như sau: T.Test (B2: B6.
  5. Tiếp theo, chúng ta sẽ nhập đối số thứ hai. Cột Sau khi ăn kiêng và kết quả của nó là đối số thứ hai của chúng tôi và phạm vi chúng tôi cần là C2: C6. Hãy thêm nó vào công thức: T.Test (B2: B6, C2: C6.
  6. Nhập dấu phẩy sau đối số thứ hai và tùy chọn phân phối một phía và phân phối hai phía sẽ tự động xuất hiện trong trình đơn thả xuống. Hãy chọn phân phối đầu tiên – một phía. Nhấp đúp vào nó.
  7. Nhập một dấu phẩy khác.
  8. Nhấp đúp vào tùy chọn Đã ghép nối trong menu thả xuống tiếp theo.
  9. Bây giờ bạn đã có tất cả các phần tử cần thiết, hãy đóng dấu ngoặc. Công thức cho ví dụ này trông giống như sau: = T.Test (B2: B6, C2: C6,1,1)
  10. Bấm phím Enter. Ô sẽ hiển thị P-giá trị ngay lập tức. Trong trường hợp của chúng tôi, giá trị là 0,133905569 hoặc 13,3905569%.

Cao hơn 5%, điều này P-value không cung cấp bằng chứng mạnh mẽ chống lại giả thuyết vô hiệu. Trong ví dụ của chúng tôi, nghiên cứu đã không chứng minh rằng ăn kiêng giúp các đối tượng thử nghiệm giảm được một lượng cân đáng kể. Điều này không nhất thiết có nghĩa là giả thuyết vô hiệu là đúng, chỉ là nó vẫn chưa bị bác bỏ.

Lộ trình phân tích dữ liệu

Công cụ Phân tích Dữ liệu cho phép bạn làm nhiều điều thú vị, bao gồm P-các phép tính giá trị. Để làm cho mọi thứ đơn giản hơn, chúng tôi sẽ sử dụng cùng một bảng như trong phương pháp trước.

Đây là cách nó được thực hiện.

  1. Vì chúng ta đã có sự khác biệt về trọng lượng trong cột D, nên chúng ta sẽ bỏ qua phép tính chênh lệch. Đối với các bảng trong tương lai, hãy sử dụng công thức này: = ”Ô 1” – “Ô 2”.
  2. Tiếp theo, nhấp vào tab Dữ liệu trong menu Chính.
  3. Chọn công cụ Phân tích dữ liệu.
  4. Cuộn xuống danh sách và nhấp vào tùy chọn t-Test: Paired Two Sample for Means.
  5. Bấm OK.
  6. Một cửa sổ bật lên sẽ xuất hiện. Nó trông như thế này:
  7. Nhập phạm vi / đối số đầu tiên. Trong ví dụ của chúng tôi, nó là B2: B6.
  8. Nhập phạm vi / đối số thứ hai. Trong trường hợp này, nó là C2: C6.
  9. Để lại giá trị mặc định trong hộp văn bản Alpha (nó là 0,05).
  10. Nhấp vào nút radio Phạm vi đầu ra và chọn nơi bạn muốn kết quả. Nếu là ô A8, hãy nhập: $ A $ 8.
  11. Bấm OK.
  12. Excel sẽ tính toán P-giá trị và một số tham số khác. Bảng cuối cùng có thể trông như thế này:

Như bạn có thể thấy, một cái đuôi P-giá trị giống như trong trường hợp đầu tiên – 0,133905569. Vì nó cao hơn 0,05 nên giả thuyết vô hiệu áp dụng cho bảng này và bằng chứng chống lại nó là yếu.

Những điều cần biết về P-Giá trị

Dưới đây là một số mẹo hữu ích liên quan đến P-giá trị tính toán trong Excel.

  1. Nếu P-value bằng 0,05 (5%), dữ liệu trong bảng của bạn là đáng kể. Nếu nó nhỏ hơn 0,05 (5%), dữ liệu bạn có rất có ý nghĩa.
  2. Trong trường hợp P-value lớn hơn 0,1 (10%), dữ liệu trong bảng của bạn là không đáng kể. Nếu nó nằm trong phạm vi 0,05-0,10, bạn có dữ liệu quan trọng.
  3. Bạn có thể thay đổi giá trị alpha, mặc dù các tùy chọn phổ biến nhất là 0,05 (5%) và 0,10 (10%).
  4. Chọn thử nghiệm hai phía có thể là lựa chọn tốt hơn, tùy thuộc vào giả thuyết của bạn. Trong ví dụ trên, kiểm tra một bên có nghĩa là chúng tôi khám phá liệu các đối tượng thử nghiệm có giảm cân sau khi ăn kiêng hay không và đó chính xác là những gì chúng tôi cần tìm hiểu. Nhưng một bài kiểm tra hai bên cũng sẽ kiểm tra xem chúng có tăng cân một cách có ý nghĩa thống kê hay không.
  5. Các P-giá trị không thể xác định các biến. Nói cách khác, nếu nó xác định được mối tương quan, nó không thể xác định được nguyên nhân đằng sau nó.

Các P-Value Demystified

Mỗi nhà thống kê đáng giá muối của mình phải biết chi tiết của việc kiểm tra giả thuyết vô hiệu và điều gì P-giá trị có nghĩa là. Kiến thức này cũng sẽ hữu ích cho các nhà nghiên cứu trong nhiều lĩnh vực khác.

Bạn đã bao giờ sử dụng Excel để tính toán P-giá trị của một mô hình thống kê? Bạn đã sử dụng phương pháp nào? Bạn có thích cách khác để tính toán nó không? Cho chúng tôi biết trong phần ý kiến.