ความสมเหตุสมผลภายใน

ในงานศึกษาวิทยาศาสตร์ ความสมเหตุสมผลภายใน^[1] (อังกฤษ: Internal validity) เป็นคุณลักษณะที่สะท้อนถึงขอบเขตหรือระดับ ที่ข้อสรุปในงานศึกษาหนึ่ง มีความสมเหตุสมผล (validity) ซึ่งก็จะขึ้นอยู่กับสมรรถภาพของงานศึกษาที่จะลดความคลาดเคลื่อนเป็นระบบ (systematic error) หรือความเอนเอียงหรืออคติ (bias)

รายละเอียด[แก้]

การอนุมานจะเรียกว่าสมเหตุสมผลทางภายใน ถ้าได้แสดงความเป็นเหตุและผลของตัวแปรสองตัว อย่างถูกต้องสมควร^[2]^[3] การอนุมานโดยเหตุและผล สามารถทำได้กับความสัมพันธ์ที่ผ่านกฎเกณฑ์ 3 อย่าง คือ

"เหตุ" เกิดก่อน "ผล" ตามกาลเวลา (temporal precedence)
"เหตุ" สัมพันธ์กับ "ผล" (มีความแปรปรวนร่วมเกี่ยว หรือ covariation)
ไม่มีคำอธิบายอย่างอื่นที่จะอธิบายความแปรปรวนร่วมเกี่ยวนั้น (nonspuriousness)^[3]

ในการทดลองทางวิทยาศาสตร์ นักวิจัยมักจะจัดแจงค่าของตัวแปรอิสระ (independent variable) เพื่อจะดูว่ามีผลอะไรต่อตัวแปรตาม (dependent variable)^[4] ยกตัวอย่างเช่น นักวิจัยอาจจะให้ยาไม่เท่ากันแต่ละครั้งระหว่างคนในกลุ่มทดลองต่าง ๆ เพื่อจะดูว่ามีผลอะไรต่อสุขภาพ ในกรณีนี้ นักวิจัยต้องการที่จะอนุมานโดยเหตุผล ว่าเหตุคือขนาดการให้ยาเท่าไร จึงจะมีผลคือความเปลี่ยนแปลงที่สังเกตเห็น และเมื่อนักวิจัยสามารถอ้างว่า การเปลี่ยนแปลงที่เห็นซึ่งก็คือตัวแปรตาม มีเหตุมาจากขนาดการใช้ยาซึ่งก็คือตัวแปรอิสระ และสามารถกำจัดสมมติฐานแข่ง (rival hypotheses คือคำอธิบายอื่นที่แสดงเหตุอื่น) ได้ การอนุมานโดยเหตุผลเช่นนี้จึงเรียกว่าสมเหตุสมผลภายใน^[5]

แต่ว่า ในกรณีหลาย ๆ กรณี ค่าผลต่าง (Effect size) ที่พบในตัวแปรตามอาจจะไม่เพียงแค่อาศัยสิ่งเหล่านี้ คือ

ค่าความต่างของตัวแปรอิสระ
กำลังทางสถิติ (Statistical power) ของเครื่องวัดที่ใช้ และวิธีการทางสถิติที่ใช้วัดและตรวจจับผลที่เห็น
วิธีทางสถิติที่ใช้ในการวิเคราะห์

แต่อาจจะมีตัวแปรหรือสถานการณ์ที่ไม่ได้ควบคุมหรือควบคุมไม่ได้ ที่มีผลเป็นคำอธิบายเพิ่มเติมหรืออีกอย่างหนึ่งสำหรับ (1) ผลที่พบ (2) ค่าผลต่างที่พบ ดังนั้น ความสมเหตุผลภายในจึงเป็นระดับค่าต่าง ๆ ไม่ใช่เป็นเพียงแค่ความสมเหตุผลหรือความไม่สมเหตุผล เพื่อที่จะให้สามารถอนุมานได้พร้อมกับความสมเหตุผลในระดับสูง จะต้องให้ความระมัดระวังในการออกแบบงานศึกษาทางวิทยาศาสตร์ กฎทั่ว ๆ ไปก็คือ ข้อสรุปจากค่าสหสัมพันธ์ที่ได้โดยปริยาย อาจจะมีระดับความสมเหตุสมผลภายใน น้อยกว่าข้อสรุปที่ได้โดยการจัดแจงค่าตัวแปรอิสระโดยตรง และถ้ามองจากมุมมองของความสมเหตุสมผลภายใน การออกแบบการทดลองที่มีระดับการควบคุมสูง (เช่น การเลือกตัวอย่างโดยสุ่ม การจัดเข้ากลุ่มทดลองและกลุ่มควบคุมโดยสุ่ม เครื่องมือเครื่องวัดที่เชื่อถือได้ กระบวนการจัดแจงที่เชื่อถือได้ การป้องกันหลีกเลี่ยงตัวแปรกวน) อาจจะเป็นมาตรฐานทอง (gold standard) ของงานวิจัยทางวิทยาศาสตร์ แต่ว่า กลยุทธ์ที่ใช้ในการควบคุมองค์ประกอบเหล่านี้ อาจจะมีผลจำกัดความใช้ได้ทั่วไป คือความสมเหตุสมผลภายนอก ของผลที่พบ

ความเสี่ยงต่อความสมเหตุสมผลภายใน[แก้]

ตัวแปรใดเกิดก่อนไม่ชัดเจน[แก้]

ความไม่ชัดเจนว่า ตัวแปรไหนเกิดก่อน อาจจะทำให้สับสนว่า ตัวแปรไหนเป็นเหตุตัวแปรไหนเป็นผล

ตัวแปรกวน[แก้]

ความสมเหตุผลของการอนุมานมีความเสี่ยงหลักคือตัวแปรกวน (Confounding variable) ซึ่งก็คือ ความเปลี่ยนแปลงที่พบในตัวแปรตาม อาจมีเหตุมาจากการมีอยู่หรือค่าความต่างของตัวแปรที่สาม ที่สัมพันธ์กับตัวแปรที่จัดแจง (คือตัวแปรที่คิดว่าเป็นตัวแปรอิสระ) ถ้าไม่สามารถกำจัดประเด็นเรื่องความสัมพันธ์ที่ไม่เป็นจริง (spurious relationship) ก็อาจจะมีสมมติฐานอื่นที่ใช้อธิบายผลที่พบได้

อคติที่เกิดจากการเลือกตัวอย่าง (Selection bias)[แก้]

อคติที่เกิดจากการเลือกตัวอย่าง (Selection bias) เป็นปัญหาเกี่ยวกับความแตกต่างระหว่างกลุ่มการทดลองที่สามารถทำปฏิกิริยาร่วมกับตัวแปรอิสระ และดังนั้นจึงอาจเป็นเหตุหนึ่งของผลต่างที่พบ ทั้งนักวิจัยทั้งผู้เข้าร่วมการทดลอง นำเข้าสู่การทดลองคุณลักษณะต่าง ๆ มากมาย บางอย่างเป็นเรื่องที่เรียนมาบางอย่างเป็นเรื่องที่มีโดยธรรมชาติ ยกตัวอย่างเช่น เพศ น้ำหนัก ผม ตา สีผิว บุคลิกภาพ สมรรถภาพทางความคิด สมรรถภาพทางกาย ทัศนคติเช่นแรงจูงใจและการให้ความร่วมมือ

ในช่วงการรับผู้ร่วมการทดลอง ถ้ามีผู้ร่วมการทดลองที่มีลักษณะเหมือนกันบางอย่างจัดเข้ากลุ่มทดลองต่าง ๆ ไม่เท่ากัน ก็จะเสี่ยงต่อความสมเหตุสมผลภายใน ยกตัวอย่างเช่น ถ้ามีสองกลุ่มคือกลุ่มทดลองกับกลุ่มควบคุม แต่มีบุคคลที่มีลักษณะที่เป็นตัวแปรกวนในสองกลุ่มไม่เท่ากัน

ประวัติศาสตร์ (History)[แก้]

เหตุการณ์ต่าง ๆ นอกการศึกษา/การทดลอง หรือที่เกิดในระหว่างการวัดค่าตัวแปรตาม อาจจะมีผลแก่ปฏิกิริยาของผู้ร่วมการทดลองต่อวิธีการดำเนินงาน บ่อยครั้ง นี่อาจจะเป็นเหตุการณ์ใหญ่ ๆ เช่น ภัยพิบัติทางธรรมชาติ การเปลี่ยนแปลงทางการเมืองเป็นต้น ที่มีผลต่อทัศนคติและพฤติกรรมของผู้ร่วมการทดลอง จนกระทั่งว่า เป็นไปไม่ได้ที่จะกำหนดว่า ความเปลี่ยนแปลงของตัวแปรตาม เกิดจากการเปลี่ยนแปลงตัวแปรอิสระ หรือเกิดจากเหตุการณ์

พัฒนาการ/การเติบโต (Maturation)[แก้]

ผู้ร่วมการทดลองอาจจะเปลี่ยนไปในระยะการทดลอง หรือแม้แต่ระหว่างการวัดผล ยกตัวอย่างเช่น เด็กเล็ก ๆ อาจจะเจริญวัยขึ้น ทำให้สามารถตั้งสมาธิได้ดีขึ้น ทั้งความเปลี่ยนแปลงแบบถาวร เช่นการเติบโตทางกายภาพ หรือแบบชั่วคราว เช่น ความล้า อาจจะเป็นข้อที่อธิบายความเปลี่ยนแปลงของตัวแปรตามได้ คือ อาจจะเปลี่ยนปฏิกิริยาของผู้ร่วมการทดลองต่อการเปลี่ยนแปลงตัวแปรอิสระ ดังนั้น เมื่อจบการศึกษาแล้ว นักวิจัยอาจจะไม่สามารถกำหนดเหตุของความเปลี่ยแปลง ว่าเกิดเพราะเวลาหรือเพราะตัวแปรอิสระ

การทดสอบซ้ำ ๆ (Repeated testing)[แก้]

การวัดผู้ร่วมการทดลองซ้ำ ๆ กันอาจทำให้เกิดความเอนเอียง คือผู้ร่วมการทดลองอาจจะจำคำตอบที่ถูกได้ หรือว่า อาจจะรู้ว่าตนเองกำลังได้รับการทดสอบ การสอบวัดระดับเชาวน์ปัญญาบ่อย ๆ ปกติจะทำให้ได้คะแนนสูงขึ้น แต่แทนที่จะสรุปได้ว่า ทักษะที่เป็นมูลฐานได้เปลี่ยนไปอย่างถาวร แต่ปรากฏการณ์ทดสอบ (testing effect) ที่พบเช่นนี้ ซึ่งเป็นเรื่องเสี่ยงต่อความสมเหตุสมผล สามารถใช้เป็นสมมติฐานอีกอย่างหนึ่งได้

การเปลี่ยนเครื่องมือ (Instrument change)[แก้]

เครื่องมือที่ใช้ในกระบวนการทดสอบสามารถเปลี่ยนผลการทดลองได้ หรือนี่อาจหมายถึงคนสังเกตการณ์มีสมาธิมากขึ้น หรือเกิดปรากฏการณ์ priming หรือมีการเปลี่ยนกฎเกณฑ์ในการตัดสินใจอย่างไม่ได้ตั้งใจ หรืออาจจะเป็นปัญหาเกี่ยวกับค่าวัดที่ผู้ร่วมการทดลองแจ้งเองที่ทำในเวลาต่าง ๆ กัน ดังนั้น ถ้าเปลี่ยนการใช้เครื่องมือ ก็จะมีผลต่อความสมเหตุสมผลภายในของข้อสรุปหลัก เพราะว่า สามารถหาคำอธิบายอื่น ๆ ได้

การถดถอยไปยังค่ามัชฌิม (Regression toward the mean)[แก้]

นี่เป็นความผิดพลาดที่เกิดขึ้นเมื่อเลือกผู้รับการทดลองโดยอาศัยคะแนนทดสอบที่สุด ๆ คือที่ห่างไปจากค่ามัชฌิมเลขคณิตมาก ยกตัวอย่างเช่น เมื่อเลือกเด็ก ๆ ที่มีคะแนนการอ่านที่แย่ที่สุดเพื่อร่วมโปรแกรมปรับปรุงการอ่าน ค่าที่ดีขึ้นของคะแนนทดสอบทำที่ท้ายโปรแกรมอาจจะเกิดจากการถดถอยไปยังค่ามัชฌิม ไม่ใช่เป็นเพราะประสิทธิภาพของโปรแกรม คือ ถ้าทดสอบเด็กอีกทีหนึ่งก่อนที่จะเข้าร่วมโปรแกรม เด็กมีโอกาสที่จะมีคะแนนดีขึ้นอยู่แล้ว โดยนัยเดียวกัน ค่าคะแนนสุด ๆ ที่เรียกว่า extreme outlier อาจจะวัดได้ในตัวอย่างเดียวของการสอบ แต่ถ้าทดสอบซ้ำ คะแนนจะกลับไปตกลงในช่วงกระจายตัวทางสถิติที่ปกติ

ความตาย/การลดจำนวน (Mortality)[แก้]

ความผิดพลาดเช่นนี้จะเกิดขึ้นถ้าการอนุมานทำต่อผู้ร่วมการทดลองที่ร่วมมือตั้งแต่ต้นไปจนจบเท่านั้น แต่ผู้ร่วมการทดลองอาจจะออกจากงานศึกษาก่อนจบ และอาจจะเป็นเพราะการศึกษาด้วยซ้ำ ยกตัวอย่างเช่น ถ้าพบว่าบุคคลที่ผ่านโปรแกรมการฝึกเลิกสูบบุหรี่ มีอัตราการเลิกบุหรี่ที่สูงกว่าคนในกลุ่มควบคุมมาก แต่ว่า ในกลุ่มทดลอง มีคน 60% จากเริ่มต้นเท่านั้นที่ยังเหลืออยู่ในโปรแกรมเมื่อจบ และถ้าการลดจำนวนลงเช่นนี้ สัมพันธ์อย่างเป็นระบบต่อลักษณะอะไรบางอย่างของงานศึกษา หรือการจัดแจงตัวแปรอิสระ หรือการใช้เครื่องมือ หรือว่า ถ้าการถอนตัวออกจากลุ่มทดลองมีผลให้เกิดความเอนเอียงในการเปรียบเทียบระหว่างกลุ่ม ก็จะมีคำอธิบายอย่างอื่นเป็นจำนวนมากที่สามารถใช้ได้กับผลต่างที่พบ

อันตรกิริยาระหว่างการเลือก-การเจริญวัย (Selection-maturation interaction)[แก้]

นี่เกิดขึ้นเมื่อตัวแปรต่าง ๆ เกี่ยวกับผู้ร่วมการทดลอง เช่น สีผม สีผิว เป็นต้น และตัวแปรเกี่ยวกับอายุ เช่น อายุ ขนาดกาย เป็นต้น มีผลต่อกันและกัน ดังนั้น ถ้ามีผลต่างกันระหว่างสองกลุ่ม ผลอาจจะมาจากความแตกต่างของอายุ ไม่ใช่จากสีผมเป็นต้น

การแพร่ (Diffusion)[แก้]

ถ้าผลที่ได้จากการบำบัดรักษา กระจายจากกลุ่มทดลองไปยังกลุ่มควบคุม อาจจะสังเกตเห็นการไม่มีความต่างกันระหว่างกลุ่มทดลองและกลุ่มควบคุม แต่นี่ไม่ได้หมายความวา ตัวแปรอิสระไม่มีผล หรือว่า ตัวแปรตามไม่สัมพันธ์กับตัวแปรอิสระ

การแข่งกัน[แก้]

พฤติกรรมของบุคคลในกลุ่มควบคุมอาจจะเปลี่ยนไปเพราะงานศึกษา ยกตัวอย่างเช่น คนในกลุ่มควบคุมอาจจะขยันทำงานเพิ่มเพื่อไม่ให้สมาชิกกลุ่มทดลองทำได้ดีกว่า ซึ่งก็ไม่ได้หมายความว่า ตัวแปรอิสระไม่มีผล หรือว่า ตัวแปรตามไม่สัมพันธ์กับตัวแปรอิสระ และโดยนัยตรงกันข้าม ค่าผลต่างที่พบในตัวแปรตามอาจจะมีเหตุมาจากกลุ่มควบคุมที่ท้อใจ ขยันน้อยกว่ามีแรงจูงใจน้อยกว่า ไม่ใช่จากความต่างของตัวแปรอิสระ

ความเอนเอียงของผู้ทดลอง[แก้]

ความเอนเอียงของผู้ทดลอง (Experimenter bias) เกิดขึ้นเมื่อผู้ทำการทดลองมีผลต่อผลต่างที่ได้อย่างไม่ได้ตั้งใจ โดยประพฤติต่อสมาชิกกลุ่มทดลองและกลุ่มควบคุมต่าง ๆ กัน ซึ่งสามารถกำจัดได้โดยออกแบบการทดลองเป็นแบบอำพรางสองฝ่าย ที่ผู้ทำการทดลองจะไม่รู้ว่าผู้ร่วมการทดลองอยู่ในกลุ่มไหน

สำหรับความเสี่ยง 8 อย่าง มีตัวย่อภาษาอังกฤษที่จำได้ง่าย ๆ คือ THIS MESS ซึ่งหมายถึงอักษรแรกในคำต่อไปนี้ คือ^[6] Repeated Testing, History, Instrument change, Statistical Regression toward the mean, Maturation, Experimental Mortality, Selection Bias and Selection Interaction.

ดูเพิ่ม[แก้]

ความสมเหตุสมผลภายนอก (External validity)
ความสมเหตุผลเชิงสถิติของข้อสรุป (Statistical conclusion validity)
ความสมเหตุสมผลทางนิเวศ (Ecological validity)

เชิงอรรถและอ้างอิง[แก้]

↑ "validity", ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑, ความสมเหตุสมผล (คณิตศาสตร์, คอมพิวเตอร์, นิติศาสตร์, ปรัชญา)
↑ Brewer, M (2000). Reis, H; Judd, C (บ.ก.). Research Design and Issues of Validity. Handbook of Research Methods in Social and Personality Psychology. Cambridge: Cambridge University Press.
↑ ^3.0 ^3.1 Shadish, W; Cook, T; Campbell, D. (2002). Experimental and Quasi-Experimental Designs for Generilized Causal Inference. Boston: Houghton Mifflin.
↑ Levine, G; Parkinson, S (1994). Experimental Methods in Psychology. Hillsdale, NJ: Lawrence Erlbaum.
↑ Liebert, RM; Liebert, LL (1995). Science and behavior: An introduction to methods of psychological research. Englewood Cliffs, NJ: Prentice Hall.
↑ Wortman, P. M. (1983). "Evaluation research - A methodological perspective". Annual Review of Psychology. 34: 223–260. doi:10.1146/annurev.ps.34.020183.001255.

แหล่งข้อมูลอื่น[แก้]

Internal validity (Social research methods)

[RoyalDict-1] "validity", ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑, ความสมเหตุสมผล (คณิตศาสตร์, คอมพิวเตอร์, นิติศาสตร์, ปรัชญา)

[2] Brewer, M (2000). Reis, H; Judd, C (บ.ก.). Research Design and Issues of Validity. Handbook of Research Methods in Social and Personality Psychology. Cambridge: Cambridge University Press.

[Shadish-3] 3.0 ^3.1 Shadish, W; Cook, T; Campbell, D. (2002). Experimental and Quasi-Experimental Designs for Generilized Causal Inference. Boston: Houghton Mifflin.

[4] Levine, G; Parkinson, S (1994). Experimental Methods in Psychology. Hillsdale, NJ: Lawrence Erlbaum.

[5] Liebert, RM; Liebert, LL (1995). Science and behavior: An introduction to methods of psychological research. Englewood Cliffs, NJ: Prentice Hall.

[6] Wortman, P. M. (1983). "Evaluation research - A methodological perspective". Annual Review of Psychology. 34: 223–260. doi:10.1146/annurev.ps.34.020183.001255.

[1]

[2]

[3]

[4]

[5]

[6]