Bạn Phanxine có gửi link đề nghị mọi người viết bài gửi Tuổi trẻ phản đối việc báo đăng bài phản khoa học/cổ vũ việc giáo viên phạt/bạo hành với học sinh. Tôi không có thời gian trau truốt bài gửi báo, chỉ xin đưa 1 nhận xét ngắn gọn về cái poll mà tác giả bài báo sử dụng. Cả tác giả lẫn biên tập viên của báo đều không có tí kiến thức nào về nghiên cứu, dẫn đến việc sử dụng kết quả của 1 cái poll hết sức vớ vẩn. Tôi phản đối việc thầy giáo bạo hành với học sinh và đã từng có bài liên quan đến chủ đề này ở đây và ở đây nên xin không nhắc lại phần này.
Tôi xin nhận xét về việc tính cỡ mẫu cho nghiên cứu/poll. Một trong những thiếu sót trong trường học của Việt Nam là không dạy về nghiên cứu và thống kê một cách bài bản. Điều này dẫn đến việc ngay cả một sốTiến sĩ, đặc biệt TS ở các nghành khoa học xã hội, không thể độc lập thiết kế một nghiên cứu và tính cỡ mẫu cho nghiên cứu. Chúng ta cứ tự hào giỏi Toán nhưng không hiểu giỏi Toán để làm gì? Ở các nền giáo dục phát triển, người tốt nghiệp Tiến sĩ, dù ở các ngành khoa học xh, y tế, giáo dục hay kinh tế, phải có kiến thức thống kê (statistics) đủ để thiết kế nghiên cứu và sử lý số liệu ở mức độ phức tạp chứ không phải là cái chi square, t test, hay 2x2 table.
Tác giả phỏng vấn 3 nhóm, mỗi nhóm chỉ vỏn vẹn 10 người mà dám đưa ra kết luận. Để tính cỡ mẫu (n) cho nghiên cứu/ poll dạng này, tác giả cần sử dụng công thức tính cỡ mẫu cho tỉ lệ quần thể (p) (sample size for population proportion with absolute precision). Vì chúng ta không biết tỉ lệ người đồng ý/ phản đối việc phạt học sinh, nên để an toàn nhất (conservative) thì tác giả cần sử dụng p= .50 (50%). Và cỡ mẫu tối thiểu mà tác giả cần cho nghiên cứu này sẽ là 385 người/ mỗi nhóm (hoặc không tác giả phải gộp ba nhóm làm một khi phân tích số liệu với n=385). Cỡ mẫu này thỏa mãn điều kiện độ tin cậy (confidence level) = 95% và độ rộng của khoảng tin cậy (confidence interval) = 5%. [Các poll nổi tiếng như Gallup thường sử dụng độ rộng 3%-4%; nghiên cứu càng tin cậy (reliable) khi độ rộng này càng nhỏ].
Một cách khác, để kiếm chứng xem việc tác giả chọn 10 người cho 1 nhóm có thỏa mãn power và tính tin cậy hay không. (Tạm coi tác giả lựa chọn người tham gia nghiên cứu một cách ngẫu nhiên). Tôi lắp p và n vào công thức và được độ rộng của khoảng tin cậy (confidence interval) ở mức 20-30% (xem phía dưới) - một nghiên cứu không hề reliable và kết quả đáng vứt vào sọt rác.
Bảng (1): 70% cộng trừ 30%
Bảng (2): 90% cộng trừ 20%
Bảng (3): 40% cộng trừ 30%
Tôi không thể đưa công thức và giải thích dài dòng lên trên này nhưng bạn nào quan tâm đến tính cỡ mẫu có thể email cho tôi. Có rất nhiều công thức tính cỡ mẫu khác nhau phụ thuộc vào loại nghiên cứu.
9 comments: