วันเสาร์ที่ 17 สิงหาคม พ.ศ. 2556

การปฏิบัติที่ผิดพลาดของนักวิจัยเกี่ยวกับการทดสอบสมมติฐาน


การปฏิบัติที่ผิดพลาดของนักวิจัยเกี่ยวกับการทดสอบสมมติฐาน

นับเป็นเวลาเกือบ 300 ปีที่ John Arbuthnot เริ่มต้นแนวทางการทดสอบสมมติฐานศูนย์ เพื่อเป็นเครื่องมือของนักวิทยาศาสตร์และต่อมานักสถิติได้แก่  Sir Ronald Fisher และ Egon  Pearson  นำวิธีการนี้มาใช้ในหลากหลายวงการทั้งในด้านการวิจัยทางการเกษตร และสาขาการวิจัยอื่น ๆ

ในขณะที่มีการใช้วิธีการนี้เพิ่มขึ้น  ก็มีข้อผิดพลาดของวิธีการนี้ปรากฏให้เห็นเด่นชัดมากขึ้นด้วย  ลองมาดูกันซิว่าข้อผิดพลาดที่เกิดขึ้นมีอะไรบ้าง  ข้อแรกคือ  การตีความว่า ผลของการวิจัยที่มีนัยสำคัญทางสถิตินั้นแปลว่า ผลของการวิจัยนั้นมีนัยสำคัญทางวิทยาศาสตร์ด้วย  ซึ่งจริงแล้วไม่ใช่  เช่น  ผลการทดลองทางวิทยาศาสตร์ที่กลุ่มทดลองใช้วิธีการลดความเครียดโดยยาจริง  และกลุ่มควบคุมใช้ยาเทียม  ผลการวิจัยพบว่ายาจริงทำให้คนไข้ลดความเครียดได้แตกต่างจากยาเทียมอย่างมีนัยสำคัญทางสถิติที่ระดับ .05  ยังไม่เพียงพอที่จะยืนยันได้ว่ายาดังกล่าว เป็นผลงานทางวิทยาศาสตร์ที่สำคัญ  ต้องมีการทดลองซ้ำในอีกหลาย ๆ สถานการณ์เพื่อให้สามารถยืนยันผลการวิจัยนี้

ข้อสองของความผิดพลาดในการใช้การทดสอบสมมติฐานศูนย์ คือ  การตีความว่า ผลการทดสอบที่ไม่สามารถปฏิเสธสมมุติฐาน  แสดงว่า ไม่มีความแตกต่างระหว่างกลุ่มหรือไม่มีความสัมพันธ์ระหว่างตัวแปร  ซึ่งที่จริงแล้วไม่ใช่ แต่เป็นเพราะเรายังไม่มีข้อมูลเพียงพอที่จะยืนยันได้ว่ามีความแตกต่างเกิดขึ้นหรือไม่  ตอนนี้อย่าเพิ่งงง!!  ลองมาดูที่มาของการทดสอบสมมติฐานศูนย์กันก่อนดีกว่า

Sir Fisher  เข้าใจดีว่า วิทยาศาสตร์ เป็นกระบวนการที่มีความต่อเนื่อง องค์ความรู้ทางวิทยาศาสตร์ มักเริ่มจากการทดลองเล็ก ๆ เพื่อการค้นพบปรากฏการณ์ที่มีประโยชน์  งานวิจัยขนาดเล็กนี้ผลของการวิจัยอาจยังมีข้อสงสัยเล็กน้อย ๆเกี่ยวกับความน่าเชื่อถือของผลวิจัย และต้องมีการทำวิจัยต่อไปอีกเพื่อขจัดข้อสงสัยเหล่านี้ โดยการออกแบบการวิจัยที่ดีขึ้น  นอกจากนี้เขาเชื่อว่าการค้นพบที่ผิดพลาดมีผลเสียน้อยกว่า การไม่สามารถค้นพบสิ่งใหม่ ๆ ดังนั้นสำหรับเขาแล้วการทดสอบสมมติฐานศูนย์ โดยเลือกระดับนัยสำคัญที่ .05  เป็นการเลือกเพื่อความสะดวกในการปฏิบัติการวิจัยที่เป็นชุดการวิจัยที่ทำให้ประเด็นวิจัยเดียวกันอย่างต่อเนื่อง  ผลสรุปจากงานวิจัยของเขามีอยู่ 3 แบบเท่านั้น คือ  1) เมื่อ p มีค่าเล็ก น้อยกว่า .05  จะสรุปว่า ผลของทรีทเมนต์มีอย่างชัดเจน  2) เมื่อความน่าจะเป็นมีค่ามากกว่า .05  จะสรุปว่า ถ้าผลของทรีทเมนต์มีจริง  แต่เราอาจไม่พบเพราะงานวิจัยมีขนาดเล็ก และ 3) เมื่อความน่าจะเป็นอยู่ใกล้เคียง เช่นอาจเป็น .055  เขาจะอภิปรายว่าควรจะออกแบบการวิจัยครั้งใหม่อย่างไร  ให้มีผลชัดเจนยิ่งขึ้น

จะเห็นว่าการใช้การทดสอบสมมติฐานศูนย์ในปัจจุบัน แตกต่างจากการใช้เมื่อสมัยดั้งเดิม เช่น  เมื่อเราอ่านงานวิจัย  เราจะพบผลการวิจัยว่า พฤติกรรมวินัยของนักเรียนกลุ่มที่ได้รับทรีทเมนต์ สูงกว่าของกลุ่มควบคุมอย่างมีนัยสำคัญทางสถิติที่ระดับ .05  แสดงว่าทรีทเม้นต์มีผลต่อการสร้างวินัยของนักเรียน  หรือ พฤติกรรมทางการบริโภคด้วยปัญญาของนักเรียนกลุ่มที่ได้รับทรีทเม้นต์  ไม่แตกต่างจากกลุ่มทดลองที่ระดับ .05  แสดงว่าทรีทเมนต์ไม่มีผลต่อการสร้างพฤติกรรมการบริโภคด้วยปัญญาในกลุ่มนักเรียน  เป็นการสรุปผลการวิจัยใน 2 รูปแบบเท่านั้น  นักวินัยสมัยใหม่จึงมีข้อผิดพลาดที่ว่า  เขาสรุปผลงานวิจัยและตีความแบบหลวม ๆ คือ  ตีความว่าไม่มีผลของทรีทเม้นต์ เมื่อ p > .05  โดยไม่มีข้อเสนอแนะเพื่อการปรับปรุงการวิจัยให้ดีขึ้น และไม่ทำการวิจัยซ้ำเมื่อ P < .05  เพื่อให้รู้อย่างชัดเจนว่าทิศทางและขนาดของผลที่เกิดจากทรีทเม้นต์เป็นเช่นไร

ในปัจจุบันนักวิจัยต้องปรับเปลี่ยนการปฏิบัติเกี่ยวกับการทดสอบนัยสำคัญของสมมติฐานศูนย์  โดยก่อนอื่นต้องมีความเข้าใจใหม่เกี่ยวกับ ระดับนัยสำคัญ และขนาดอิทธิพล  ประเด็นแรกเรื่องระดับนัยสำคัญ  นักวิจัยรุ่นใหม่ไม่จำเป็นต้องจำกัดการรายงานผลการวิจัยอยู่ที่ระดับ .05  .01  หรือ .001  แต่ควรรายงานผลการวิจัยตามระดับนัยสำคัญที่แท้จริง ซึ่งคำนวณมาจากข้อมูล เช่น  “P = .06”  และให้ผู้อ่านประเมินเองว่ามีนัยสำคัญอย่างไร  ระดับนัยสำคัญจะบอกให้ทราบว่าทิศทางของผลอยู่ในทิศทางใด และถ้านักวิจัยต้องการจะตีความระดับนัยสำคัญแบบ 2 ขั้ว ผลนี้เกิดขึ้นโดยบังเอิญ หรือ ผลนี้เกิดขึ้นไม่ใช่เหตุบังเอิญ  ผู้วิจัยต้องกำหนดระดับนัยสำคัญไว้ก่อน  และมีคำอธิบายประกอบการกำหนดระดับนัยสำคัญ ซึ่งไม่ควรจะคงที่เสมอไป  และควรจะปรับเปลี่ยนไป  ขึ้นอยู่กับสภาวะของการทำวิจัยครั้งนั้น ๆ เช่น ถ้านักวิจัยต้องการวิจัยในเรื่องใดเรื่องหนึ่งแบบต่อเนื่องเป็นชุดของงานวิจัย อาจเริ่มต้นที่ระดับนัยสำคัญที่ .05  แต่ถ้านักวิจัยทำวิจัยในเรื่องที่มีผลกระทบต่อสังคมที่รุนแรง อาจตั้งระดับนัยสำคัญที่ .01

คำแนะนำสำหรับนักวิจัยรุ่นใหม่ คือ  การรายงานผลการทดสอบนัยสำคัญของสมมติฐานศูนย์ เมื่อ P มีค่าน้อยกว่า .05 ควรสรุปว่า ทิศทางของความแตกต่างระหว่างค่าเฉลี่ยปรากฏชัดเจน คือ  ค่าเฉลี่ยของกลุ่มทดลองสูงกว่าค่าเฉลี่ยของกลุ่มควบคุม หรือเมื่อ P มีค่ามากกว่า .05  ควรสรุปว่า ความแตกต่างระหว่างกลุ่มยังไม่สามารถระบุได้ หรือความสัมพันธ์ระหว่างตัวแปรทั้งสองยังไม่สามารถระบุได้  ต้องมีข้อมูลมากกว่านี้ อาจจะสามารถสรุปได้

ประเด็นที่สองคือ  ขนาดอิทธิพลที่บ่งบอกว่า ตัวแปรต้นนั้นมีผลมากหรือน้อยต่อการเปลี่ยนแปลงที่เกิดขึ้นกับตัวแปรตาม  ในขณะที่การทดสอบนัยสำคัญของสมมติฐานศูนย์บ่งบอกทิศทางของผลที่เกิดขึ้น  ดังนั้นจึงมีความจำเป็นที่ผลของการวิจัยต้องระบุทั้งขนาดอิทธิพล และระดับนัยสำคัญพร้อม ๆ กัน  นักวิจัยควรหลีกเลี่ยงการตีความขนาดอิทธิพลโดยใช้คำบรรยายว่า มีขนาด เล็ก ปานกลาง หรือใหญ่  โดยไม่คำนึงถึงปัจจัยอื่น ๆ เช่น  ประเภทของการวิจัย  ตัวแปรต้นและตัวแปรตามคืออะไร  การตีความในลักษณะนี้ควรทำโดยนักวิจัยที่มีความคุ้นเคยและเชี่ยวชาญในประเด็นวินัยนั้นเท่านั้น

โดยสรุปแล้ว การทดสอบสมมติฐานศูนย์ เกิดขึ้นและถูกใช้ในงานวิจัยมาเกือบ 300 ปี  และเราพบว่าความผิดพลาดของวิธีการนี้เกิดจากผู้ใช้และผู้ตีความงานวิจัย ที่ขาดความรู้เกี่ยวกับที่มาของวิธีการ และเจตนาของผู้เริ่มต้นประยุกต์ใช้ในการวิจัย  วิธีการนี้ยังคงมีประโยชน์อย่างยิ่งต่อกระบวนการทางวิทยาศาสตร์  เพราะจะบอกทิศทางของผลที่เกิดขึ้น  และเมื่อใช้ร่วมกับขนาดอิทธิพลจะให้ความน่าเชื่อถือเกี่ยวกับขนาดอิทธิพลที่พบ แต่ไม่ค่อยมีประโยชน์นักถ้างานวิจัยมีขนาดของกลุ่มตัวอย่างที่ใหญ่เพราะจะพบผลที่มีนัยสำคัญบ่อยเกินไป  การทดสอบนัยสำคัญของสมมติฐานศูนย์มีประโยชน์สูงสุด เพื่อใช้กับชุดของการวิจัยที่ที่ต่อเนื่องกันทั้งในแบบที่เป็นการทำซ้ำ และการทำซ้ำโดยขยายขอบเขตของงานวิจัย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น