การปฏิบัติที่ผิดพลาดของนักวิจัยเกี่ยวกับการทดสอบสมมติฐาน
นับเป็นเวลาเกือบ
300 ปีที่ John Arbuthnot เริ่มต้นแนวทางการทดสอบสมมติฐานศูนย์
เพื่อเป็นเครื่องมือของนักวิทยาศาสตร์และต่อมานักสถิติได้แก่ Sir Ronald Fisher และ Egon Pearson
นำวิธีการนี้มาใช้ในหลากหลายวงการทั้งในด้านการวิจัยทางการเกษตร
และสาขาการวิจัยอื่น ๆ
ในขณะที่มีการใช้วิธีการนี้เพิ่มขึ้น
ก็มีข้อผิดพลาดของวิธีการนี้ปรากฏให้เห็นเด่นชัดมากขึ้นด้วย
ลองมาดูกันซิว่าข้อผิดพลาดที่เกิดขึ้นมีอะไรบ้าง ข้อแรกคือ
การตีความว่า ผลของการวิจัยที่มีนัยสำคัญทางสถิตินั้นแปลว่า
ผลของการวิจัยนั้นมีนัยสำคัญทางวิทยาศาสตร์ด้วย
ซึ่งจริงแล้วไม่ใช่ เช่น ผลการทดลองทางวิทยาศาสตร์ที่กลุ่มทดลองใช้วิธีการลดความเครียดโดยยาจริง
และกลุ่มควบคุมใช้ยาเทียม
ผลการวิจัยพบว่ายาจริงทำให้คนไข้ลดความเครียดได้แตกต่างจากยาเทียมอย่างมีนัยสำคัญทางสถิติที่ระดับ
.05
ยังไม่เพียงพอที่จะยืนยันได้ว่ายาดังกล่าว เป็นผลงานทางวิทยาศาสตร์ที่สำคัญ ต้องมีการทดลองซ้ำในอีกหลาย ๆ
สถานการณ์เพื่อให้สามารถยืนยันผลการวิจัยนี้
ข้อสองของความผิดพลาดในการใช้การทดสอบสมมติฐานศูนย์
คือ การตีความว่า
ผลการทดสอบที่ไม่สามารถปฏิเสธสมมุติฐาน
แสดงว่า
ไม่มีความแตกต่างระหว่างกลุ่มหรือไม่มีความสัมพันธ์ระหว่างตัวแปร ซึ่งที่จริงแล้วไม่ใช่
แต่เป็นเพราะเรายังไม่มีข้อมูลเพียงพอที่จะยืนยันได้ว่ามีความแตกต่างเกิดขึ้นหรือไม่ ตอนนี้อย่าเพิ่งงง!! ลองมาดูที่มาของการทดสอบสมมติฐานศูนย์กันก่อนดีกว่า
Sir
Fisher เข้าใจดีว่า
วิทยาศาสตร์ เป็นกระบวนการที่มีความต่อเนื่อง องค์ความรู้ทางวิทยาศาสตร์
มักเริ่มจากการทดลองเล็ก ๆ เพื่อการค้นพบปรากฏการณ์ที่มีประโยชน์
งานวิจัยขนาดเล็กนี้ผลของการวิจัยอาจยังมีข้อสงสัยเล็กน้อย ๆเกี่ยวกับความน่าเชื่อถือของผลวิจัย
และต้องมีการทำวิจัยต่อไปอีกเพื่อขจัดข้อสงสัยเหล่านี้
โดยการออกแบบการวิจัยที่ดีขึ้น
นอกจากนี้เขาเชื่อว่าการค้นพบที่ผิดพลาดมีผลเสียน้อยกว่า
การไม่สามารถค้นพบสิ่งใหม่ ๆ ดังนั้นสำหรับเขาแล้วการทดสอบสมมติฐานศูนย์
โดยเลือกระดับนัยสำคัญที่ .05
เป็นการเลือกเพื่อความสะดวกในการปฏิบัติการวิจัยที่เป็นชุดการวิจัยที่ทำให้ประเด็นวิจัยเดียวกันอย่างต่อเนื่อง ผลสรุปจากงานวิจัยของเขามีอยู่ 3 แบบเท่านั้น
คือ 1) เมื่อ p
มีค่าเล็ก น้อยกว่า .05 จะสรุปว่า
ผลของทรีทเมนต์มีอย่างชัดเจน 2) เมื่อความน่าจะเป็นมีค่ามากกว่า
.05 จะสรุปว่า
ถ้าผลของทรีทเมนต์มีจริง
แต่เราอาจไม่พบเพราะงานวิจัยมีขนาดเล็ก และ 3)
เมื่อความน่าจะเป็นอยู่ใกล้เคียง เช่นอาจเป็น .055 เขาจะอภิปรายว่าควรจะออกแบบการวิจัยครั้งใหม่อย่างไร ให้มีผลชัดเจนยิ่งขึ้น
จะเห็นว่าการใช้การทดสอบสมมติฐานศูนย์ในปัจจุบัน
แตกต่างจากการใช้เมื่อสมัยดั้งเดิม เช่น
เมื่อเราอ่านงานวิจัย
เราจะพบผลการวิจัยว่า “พฤติกรรมวินัยของนักเรียนกลุ่มที่ได้รับทรีทเมนต์
สูงกว่าของกลุ่มควบคุมอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 แสดงว่าทรีทเม้นต์มีผลต่อการสร้างวินัยของนักเรียน” หรือ “พฤติกรรมทางการบริโภคด้วยปัญญาของนักเรียนกลุ่มที่ได้รับทรีทเม้นต์ ไม่แตกต่างจากกลุ่มทดลองที่ระดับ .05
แสดงว่าทรีทเมนต์ไม่มีผลต่อการสร้างพฤติกรรมการบริโภคด้วยปัญญาในกลุ่มนักเรียน” เป็นการสรุปผลการวิจัยใน 2
รูปแบบเท่านั้น นักวินัยสมัยใหม่จึงมีข้อผิดพลาดที่ว่า เขาสรุปผลงานวิจัยและตีความแบบหลวม ๆ คือ ตีความว่าไม่มีผลของทรีทเม้นต์ เมื่อ p
> .05 โดยไม่มีข้อเสนอแนะเพื่อการปรับปรุงการวิจัยให้ดีขึ้น
และไม่ทำการวิจัยซ้ำเมื่อ P < .05
เพื่อให้รู้อย่างชัดเจนว่าทิศทางและขนาดของผลที่เกิดจากทรีทเม้นต์เป็นเช่นไร
ในปัจจุบันนักวิจัยต้องปรับเปลี่ยนการปฏิบัติเกี่ยวกับการทดสอบนัยสำคัญของสมมติฐานศูนย์ โดยก่อนอื่นต้องมีความเข้าใจใหม่เกี่ยวกับ
ระดับนัยสำคัญ และขนาดอิทธิพล
ประเด็นแรกเรื่องระดับนัยสำคัญ
นักวิจัยรุ่นใหม่ไม่จำเป็นต้องจำกัดการรายงานผลการวิจัยอยู่ที่ระดับ
.05 .01
หรือ .001
แต่ควรรายงานผลการวิจัยตามระดับนัยสำคัญที่แท้จริง ซึ่งคำนวณมาจากข้อมูล
เช่น “P = .06” และให้ผู้อ่านประเมินเองว่ามีนัยสำคัญอย่างไร
ระดับนัยสำคัญจะบอกให้ทราบว่าทิศทางของผลอยู่ในทิศทางใด
และถ้านักวิจัยต้องการจะตีความระดับนัยสำคัญแบบ 2 ขั้ว “ผลนี้เกิดขึ้นโดยบังเอิญ” หรือ “ผลนี้เกิดขึ้นไม่ใช่เหตุบังเอิญ” ผู้วิจัยต้องกำหนดระดับนัยสำคัญไว้ก่อน และมีคำอธิบายประกอบการกำหนดระดับนัยสำคัญ
ซึ่งไม่ควรจะคงที่เสมอไป
และควรจะปรับเปลี่ยนไป
ขึ้นอยู่กับสภาวะของการทำวิจัยครั้งนั้น ๆ เช่น ถ้านักวิจัยต้องการวิจัยในเรื่องใดเรื่องหนึ่งแบบต่อเนื่องเป็นชุดของงานวิจัย
อาจเริ่มต้นที่ระดับนัยสำคัญที่ .05
แต่ถ้านักวิจัยทำวิจัยในเรื่องที่มีผลกระทบต่อสังคมที่รุนแรง
อาจตั้งระดับนัยสำคัญที่ .01
คำแนะนำสำหรับนักวิจัยรุ่นใหม่
คือ การรายงานผลการทดสอบนัยสำคัญของสมมติฐานศูนย์
เมื่อ P มีค่าน้อยกว่า .05 ควรสรุปว่า “ทิศทางของความแตกต่างระหว่างค่าเฉลี่ยปรากฏชัดเจน คือ
ค่าเฉลี่ยของกลุ่มทดลองสูงกว่าค่าเฉลี่ยของกลุ่มควบคุม” หรือเมื่อ P มีค่ามากกว่า .05 ควรสรุปว่า “ความแตกต่างระหว่างกลุ่มยังไม่สามารถระบุได้
หรือความสัมพันธ์ระหว่างตัวแปรทั้งสองยังไม่สามารถระบุได้ ต้องมีข้อมูลมากกว่านี้ อาจจะสามารถสรุปได้”
ประเด็นที่สองคือ ขนาดอิทธิพลที่บ่งบอกว่า
ตัวแปรต้นนั้นมีผลมากหรือน้อยต่อการเปลี่ยนแปลงที่เกิดขึ้นกับตัวแปรตาม
ในขณะที่การทดสอบนัยสำคัญของสมมติฐานศูนย์บ่งบอกทิศทางของผลที่เกิดขึ้น
ดังนั้นจึงมีความจำเป็นที่ผลของการวิจัยต้องระบุทั้งขนาดอิทธิพล
และระดับนัยสำคัญพร้อม ๆ กัน
นักวิจัยควรหลีกเลี่ยงการตีความขนาดอิทธิพลโดยใช้คำบรรยายว่า มีขนาด เล็ก
ปานกลาง หรือใหญ่
โดยไม่คำนึงถึงปัจจัยอื่น ๆ เช่น
ประเภทของการวิจัย ตัวแปรต้นและตัวแปรตามคืออะไร
การตีความในลักษณะนี้ควรทำโดยนักวิจัยที่มีความคุ้นเคยและเชี่ยวชาญในประเด็นวินัยนั้นเท่านั้น
โดยสรุปแล้ว
การทดสอบสมมติฐานศูนย์ เกิดขึ้นและถูกใช้ในงานวิจัยมาเกือบ 300 ปี
และเราพบว่าความผิดพลาดของวิธีการนี้เกิดจากผู้ใช้และผู้ตีความงานวิจัย
ที่ขาดความรู้เกี่ยวกับที่มาของวิธีการ
และเจตนาของผู้เริ่มต้นประยุกต์ใช้ในการวิจัย
วิธีการนี้ยังคงมีประโยชน์อย่างยิ่งต่อกระบวนการทางวิทยาศาสตร์ เพราะจะบอกทิศทางของผลที่เกิดขึ้น
และเมื่อใช้ร่วมกับขนาดอิทธิพลจะให้ความน่าเชื่อถือเกี่ยวกับขนาดอิทธิพลที่พบ
แต่ไม่ค่อยมีประโยชน์นักถ้างานวิจัยมีขนาดของกลุ่มตัวอย่างที่ใหญ่เพราะจะพบผลที่มีนัยสำคัญบ่อยเกินไป
การทดสอบนัยสำคัญของสมมติฐานศูนย์มีประโยชน์สูงสุด
เพื่อใช้กับชุดของการวิจัยที่ที่ต่อเนื่องกันทั้งในแบบที่เป็นการทำซ้ำ
และการทำซ้ำโดยขยายขอบเขตของงานวิจัย
ไม่มีความคิดเห็น:
แสดงความคิดเห็น