อคติที่เกิดจากการเลือกตัวอย่าง

อคติที่เกิดจากการเลือกตัวอย่าง^[1] หรือ ความเอนเอียงโดยการคัดเลือก^[2] (อังกฤษ: Selection bias) คือความผิดพลาดทางสถิติ เนื่องมาจากวิธีการเลือกตัวอย่างหรือกลุ่มตัวอย่างในงานศึกษาทางวิทยาศาสตร์ ที่โดยเฉพาะหมายถึงการคัดเลือกบุคคล กลุ่ม หรือข้อมูลเพื่อทำการวิเคราะห์ โดยที่ไม่มีการสุ่ม (randomization) ที่สมควร และดังนั้นจึงทำให้ตัวอย่างที่ชัก ไม่สามารถเป็นตัวแทนประชากรที่ต้องการจะวิเคราะห์^[3] ตัวอย่างเช่น^[4]

การสำรวจที่ได้ข้อมูลจากอาสาสมัคร หรือบุคคลเฉพาะสถานที่ ที่ใดที่หนึ่ง ในช่วงเวลาช่วงใดช่วงหนึ่ง
งานศึกษาในคนไข้โรงพยาบาลที่อยู่ใต้การดูแลของหมอ โดยไม่ได้รวมบุคคลที่เสียชีวิตเพราะมีอาการรุนแรงจากโรคก่อนที่จะเข้าโรงพยาบาล ไม่ได้รวมคนที่ยังไม่ป่วยพอที่จะเข้าโรงพยาบาล และไม่ได้รวมคนที่อาจจะมีปัญหาเกี่ยวกับค่าใช้จ่าย การเดินทาง หรือปัญหาอื่น ๆ

เป็นปรากฏการณ์ที่บางครั้งเรียกว่า selection effect (ปรากฏการณ์การคัดเลือก) และหากไม่พิจารณาผลของความเอนเอียงจากการคัดเลือก จะทำให้การสรุปผลจากตัวอย่างงานวิจัยนั้นผิดพลาด

ประเภท

ความเอนเอียงนี้มีหลายประเภท รวมทั้งหัวข้อย่อยต่าง ๆ ดังต่อไปนี้

ความเอนเอียงโดยการสุ่มตัวอย่าง

ความเอนเอียงโดยการสุ่มตัวอย่าง^[5] (อังกฤษ: Sampling bias) เป็นความผิดพลาดอย่างเป็นระบบเนื่องจากการชักตัวอย่างที่ไม่ได้สุ่มจากกลุ่มประชากร^[6] ทำให้ชักบุคคลแต่ละพวกโดยโอกาสที่ไม่เท่ากัน มีผลเป็นตัวอย่างที่ไม่สมดุล (biased sample) ซึ่งมีนิยามว่า เป็นการชักตัวอย่างทางสถิติจากกลุ่มประชากร (หรือองค์อย่างอื่นที่ไม่เกี่ยวกับมนุษย์) ที่ไม่สมดุล ที่ไม่สามารถเป็นตัวแทนของกลุ่มประชากรได้^[7]

ความเอนเอียงนี้ มักจะจำแนกว่าเป็นแบบย่อยของความเอนเอียงโดยการคัดเลือก^[8] และบางครั้งจะเรียกอย่างเฉพาะเจาะจงว่า sample selection bias^[9]^[10]^[11] แต่บางครั้งก็จัดเป็นความเอนเอียงต่างหากเช่นกัน^[12] ตัวอย่างของความเอนเอียงโดยการสุ่มตัวอย่างก็คือ การที่ผู้ร่วมการทดลองจัดตัวเองเข้ากลุ่ม (เช่นเป็นอาสาสมัคร) การคัดเลือกผู้เข้าร่วมการทดลอง (pre-screening) การตัดข้อมูลผู้ป่วยหรือการตรวจสอบที่ไม่เสร็จบริบูรณ์ และการตัดข้อมูลผู้ป่วยที่ย้ายออกจากพื้นที่การศึกษา (migration bias)

โดยหยุดการทดลองที่ยังไม่เสร็จ

หยุดการทดลองที่ยังทำไม่สมบูรณ์ ในขณะที่ผลกำลังสนับสนุนสมมุติฐานที่ต้องการ
หยุดการทดลองเพราะได้ค่าที่สุดโต่ง (บ่อยครั้งเพราะเหตุผลทางจริยธรรม) แต่ค่าสุดโต่งอาจจะมาจากตัวแปรที่มีค่าความแปรปรวนระดับสูงสุด แม้ว่า ตัวแปรที่เหลือจะมีค่าใกล้ ๆ กับค่าเฉลี่ย

โดยปัจจัยที่ได้รับ

Susceptibility bias
- Clinical susceptibility bias คือเมื่อโรคชนิดหนึ่งเพิ่มโอกาสให้เกิดโรคชนิดที่สอง การรักษาโรคแรก (ปัจจัยที่ได้รับ) จึงปรากฏผิดพลาดเหมือนกับเพิ่มโอกาสให้โรคที่สอง ยกตัวอย่างเช่นการหมดระดูเพิ่มโอกาสให้เกิดโรคมะเร็งเยื่อบุมดลูก ดังนั้น จึงโทษฮอร์โมนเอสโทรเจนที่ให้เพื่อแก้ปัญหาเกี่ยวกับการหมดระดู ว่าเป็นเหตุให้เกิดมะเร็ง^[13]
- Protopathic bias คือ เมื่อการรักษาอาการแรกที่เกิดขึ้นของโรคหรือของผลที่เป็นประเด็นศึกษา (ปัจจัยที่ได้รับ) ดูเหมือนจะเป็นเหตุให้เกิดผล เป็นความเอนเอียงที่อาจจะมีได้เมื่อช่วงระยะเวลาระหว่างการเกิดอาการแรกและการเริ่มการรักษา กับการวินิจฉัยว่ามีผลที่เป็นประเด็นเกิดขึ้นแล้ว ห่างกัน^[13] ซึ่งสามารถบริหารได้ด้วยวิธี lagging ซึ่งก็คือ การไม่ถือเอาปัจจัยที่ได้รับ (เช่นการรักษา) ถ้าเกิดก่อนการวินิจฉัยเป็นช่วงระยะเวลาหนึ่ง^[14]
- Indication bias คือความเอนเอียงที่เกิดขึ้น เมื่อมีตัวชี้อย่างหนึ่งที่สัมพันธ์ทั้งกับการเริ่มให้การรักษา (หรือการได้ปัจจัย) และกับผลเช่นโรคที่เกิดขึ้น^[15] ยกตัวอย่างเช่น การเริ่มรักษาบุคคลที่มีโอกาสเสี่ยงสูงที่จะเกิดโรค อาจทำให้คนที่ได้รับการรักษามีอัตราสูงกว่าในการเกิดโรค ทำให้ปรากฏอย่างผิด ๆ ว่า การรักษาโรคที่ให้ เป็นเหตุของโรค^[16]

โดยข้อมูล

การแบ่งข้อมูลเป็นส่วน ๆ โดยรู้ว่าในแต่ละส่วนมีข้อมูลอะไร แล้ววิเคราะห์ข้อมูล โดยวิธีที่ออกแบบให้ใช้กับข้อมูลที่ไม่รู้ว่าส่วนต่าง ๆ มีข้อมูลอะไร
การคัดทิ้งข้อมูล "เสีย" ตามอำเภอใจ โดยไม่ใช้กฎเกณฑ์ที่ได้ตั้งไว้หรือที่เป็นที่ยอมรับโดยทั่วไป
การคัดทิ้งข้อมูลแบบ "outliers" คือที่ต่างจากค่าอื่น ๆ จนกระทั่งสงสัยว่าเป็นความผิดพลาดทางสถิติ แต่ไม่ได้คำนึงถึงข้อมูลสำคัญที่อาจจะได้จากค่าเช่นนั้น^[17]

โดยวิธีการศึกษา

เลือกงานศึกษาอย่างไม่สมควร ที่จะใช้เป็นข้อมูลของงานวิเคราะห์อภิมาน (meta-analysis)
ทำการทดลองซ้ำ ๆ จนกว่าจะได้ผลที่ต้องการ โดยเรียกการทดลองที่ทำก่อน ๆ ว่าเป็น "การทดสอบเทียบมาตรฐาน" "ความคลาดเคลื่อนของเครื่องมือวัด" หรือ "การสำรวจเบื้องต้น"
แสดงผลที่มีนัยสำคัญจากงานที่ทดสอบสมมุติฐานเป็นจำนวนมากกับข้อมูลเดียวกัน (data dredging) ซึ่งมีโอกาสแสดงนัยสำคัญที่เป็นเรื่องบังเอิญ จริง ๆ แล้วเป็นความผิดพลาดที่เหมือนกับข้อที่แล้ว แต่ว่า พิจารณาว่า เป็นการทุจริตน้อยกว่า

โดยการลดจำนวนคน

Attrition bias (ความเอนเอียงโดยลดจำนวนคน) เป็นความเอนเอียงโดยการคัดเลือกเพราะเหตุผู้ร่วมการทดลองลดจำนวนลง^[18] ซึ่งเกิดจากการคัดออกซึ่งผู้ร่วมการทดลอง หรือค่าการทดสอบ ที่ไม่สามารถทำให้ถึงที่สุดได้ ซึ่งอาจจะเกิดจากการถอนตัว การไม่ส่งตอบข้อมูล หรือไม่ทำตามกฎเกณฑ์ เป็นการกระทำที่สร้างความเอนเอียงต่อผล เมื่อมีความไม่สมดุลเกี่ยวกับปัจจัยที่ได้รับ และ/หรือผลที่เกิดขึ้น ยกตัวอย่างเช่น ในงานศึกษาโปรแกรมควบคุมอาหาร นักวิจัยอาจจะทิ้งข้อมูลของทุก ๆ คนที่ถอนตัวจากการทดลอง แต่ว่า คนโดยมากอาจจะถอนตัวเพราะโปรแกรมไม่ได้ผล ดังนั้น การสูญเสียผู้ร่วมการทดลองทั้งในกลุ่มทดลองและในกลุ่มเปรียบเทียบ อาจจะเปลี่ยนลักษณะต่าง ๆ ของกลุ่มทั้งสอง และเปลี่ยนผลที่เกิดขึ้น ไม่ว่าปัจจัยทางสุขภาพอะไร (เช่นการควบคุมอาหาร) จะเป็นประเด็นการศึกษา^[18]

โดยการคัดเลือกของผู้สังเกตการณ์

ข้อมูลไม่ได้เกิดการเลือกสรร โดยเหตุแบบการทดลองและการวัดค่าต่าง ๆ เท่านั้น แต่อาจจะเกิดเพราะมีผู้สังเกตการณ์ ความเอนเอียงโดยการคัดเลือกของผู้สังเกตการณ์ (observer bias) จะเกิดขึ้น ในสถานการณ์ที่การมีผู้สังเกตการณ์ หรือแม้แต่การมีการทดลอง มีสหสัมพันธ์กับข้อมูลที่ได้^[19]

ยกตัวอย่างเช่น ประวัติการมีวัตถุอวกาศต่าง ๆ มากระทบโลกจะมีความเอนเอียงที่เกิดจากมีผู้สังเกตการณ์ คือ ถ้ามีวัตถุขนาดใหญ่มากระทบโลก ก็จะทำให้เกิดการสูญพันธุ์หมู่ สร้างความเสียหายกับระบบนิเวศ ขัดขวางวิวัฒนาการของผู้สังเกตการณ์ เป็นระยะเวลายาวนาน ดังนั้น จึงจะไม่มีใครที่จะสังเกตพบหลักฐานของวัตถุอวกาศขนาดใหญ่มากระทบโลกที่เกิดขึ้นเมื่อไม่นานมานี้ (ไม่เช่นนั้นแล้วคนสังเกตก็จะไม่มี) ดังนั้น อาจจะมีความเอนเอียงในประวัติการกระทบโลกของวัตถุอวกาศ^[20] มหันตภัยทางดาราศาสตร์ ที่มีผลกระทบทั้งโลกแบบอื่น ๆ (นอกจากวัตถุอวกาศมากกระทบโลก) ก็อาจจะมีการประเมินโอกาสต่ำไปเช่นเดียวกัน^[21]

การป้องกัน

โดยทั่ว ๆ ไปแล้ว ความเอนเอียงโดยการคัดเลือกไม่สามารถแก้ได้โดยวิธีการวิเคราะห์ทางสถิติเพียงอย่างเดียว แม้ว่า วิธี Heckman correction อาจใช้ได้ในบางกรณี การประเมินระดับความเอนเอียงแบบอรูปนัย อาจทำได้โดยตรวจสอบสหสัมพันธ์ระหว่างตัวแปรภายนอก (exogenous หรือ background) กับตัวชี้บอกการรักษา (treatment indicator) แต่ปัญหาก็คือสหสัมพันธ์ระหว่างเหตุกำหนดผลที่ไม่รู้ กับตัวกำหนดการคัดเลือกตัวอย่างที่ไม่รู้ที่นำไปสู่การประเมินผลที่เอนเอียง จะไม่สามารถประเมินได้โดยตรงจากตัวชี้บอกการรักษาที่สังเกตได้^[22]

ความเอนเอียงที่สัมพันธ์กัน

ความเอนเอียงนี้สัมพันธ์กับ

ความเอนเอียงในการตีพิมพ์ (publication bias) ซึ่งเป็นรูปแบบของความเอนเอียงโดยการรายงาน (reporting bias) เป็นความบิดเบือนต่อความรู้ในชุมชนหรือในงานวิเคราะห์อภิมาน ที่เกิดจาการไม่ตีพิมพ์ผลที่ไม่น่าสนใจ (โดยปกติคือผลลบหรือผลว่าง) หรือผลที่ไม่เป็นไปตามความคาดหวังของผู้ทำการทดลอง ของผู้ให้เงินทุนสนับสนุน หรือของชุมชนโดยทั่วไป
ความเอนเอียงเพื่อยืนยัน (confirmation bias) เป็นความบิดเบือนที่เกิดขึ้นจากการทดลองที่มุ่งจะสืบหาหลักฐานที่ยืนยันสมมุติฐาน แทนที่จะพยายามพิสูจน์ความเท็จของสมมุติฐาน
exclusion bias (ความเอนเอียงโดยการยกเว้น) เป็นความบิดเบือนที่เกิดขึ้น เนื่องจากใช้กฎเกณฑ์ที่ต่างกัน ในการตรวจรับผู้ร่วมการทดลองเข้าในกลุ่มทดลองหรือในกลุ่มควบคุม

ดูเพิ่ม

เชิงอรรถและอ้างอิง

↑ "พบคำศัพท์ bias ทั้งหมด 28 รายการ". สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ. สืบค้นเมื่อ 23 April 2015.^{[ลิงก์เสีย]}
↑ "ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑", ให้ความหมายของ selection ว่า "การคัดเลือก, การเลือกสรร, และการเลือกหา"
↑ "Dictionary of Cancer Terms → selection bias". Dictionary of Cancer Terms. สืบค้นเมื่อ 23 September 2009.
↑ Last, John M. (2001). A Dictionary of Epidemiology (4 ed.). Oxford University Press. Selection bias - p. 166. ISBN 978-0-19-514169-6.
↑ sampling = [N] การสุ่มตัวอย่าง "Lexitron พจนานุกรมไทย<=>อังกฤษ รุ่น 2.6". หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา, ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, กระทรวงวิทยาศาสตร์และเทคโนโลยี. 2546.
↑ "Medical Dictionary - 'Sampling Bias'". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 10 March 2016. สืบค้นเมื่อ 23 September 2009.
↑ Mosby's Medical Dictionary, 8th edition อ้างอิงโดย "TheFreeDictionary → biased sample". สืบค้นเมื่อ 23 September 2009.
↑ "Dictionary of Cancer Terms → Selection Bias". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 9 June 2009. สืบค้นเมื่อ 23 September 2009.
↑ Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. 22 (2): 103–115. doi:10.1016/S0145-2134(97)00131-2. PMID 9504213.
↑ Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). "Sample Selection Bias Correction Theory" (PDF). Algorithmic Learning Theory. 5254: 38–53. doi:10.1007/978-3-540-87987-9_8.
↑ Cortes, Corinna; Mohri, Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. 519: 103–126. doi:10.1016/j.tcs.2013.09.027.
↑ Fadem, Barbara (2009). Behavioral Science. Lippincott Williams & Wilkins. p. 262. ISBN 978-0-7817-8257-9.
↑ ^13.0 ^13.1 Feinstein, AR; Horwitz, RI (November 1978). "A critique of the statistical evidence associating estrogens with endometrial cancer". Cancer Res. 38 (11 Pt 2): 4001–5. PMID 698947.{{cite journal}}: CS1 maint: multiple names: authors list (ลิงก์)
↑ Tamim, H; Monfared, AA; LeLorier J (March 2007). "Application of lag-time into exposure definitions to control for protopathic bias". Pharmacoepidemiol Drug Saf. 16 (3): 250–8. doi:10.1002/pds.1360. PMID 17245804.{{cite journal}}: CS1 maint: multiple names: authors list (ลิงก์)
↑ Last, John M. (2001). A Dictionary of Epidemiology (4 ed.). Oxford University Press. Confounding by indication - p.38. ISBN 978-0-19-514169-6.
↑ Matthew R. Weir (2005). Hypertension (Key Diseases) (Acp Key Diseases Series). Philadelphia, Pa: American College of Physicians. p. 159. ISBN 1-930513-58-5.
↑ Kruskal, William H. (1960). "Some Remarks on Wild Observations". Technometrics. 2 (1): 1–3. doi:10.1080/00401706.1960.10489875. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2010-01-26. สืบค้นเมื่อ 6 May 2015.
↑ ^18.0 ^18.1 doi:10.1093/ije/dyh406
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand
↑ Bostrom, Nick (2002). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. ISBN 0-415-93858-9.
↑ doi:10.1111/j.1539-6924.2010.01460.x
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand
↑ doi:10.1038/438754a
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand
↑ doi:10.2307/1912352
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand

[1] "พบคำศัพท์ bias ทั้งหมด 28 รายการ". สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ. สืบค้นเมื่อ 23 April 2015.^{[ลิงก์เสีย]}

[RoyalDict-2] "ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑", ให้ความหมายของ selection ว่า "การคัดเลือก, การเลือกสรร, และการเลือกหา"

[DCT-3] "Dictionary of Cancer Terms → selection bias". Dictionary of Cancer Terms. สืบค้นเมื่อ 23 September 2009.

[Dict2001-166-4] Last, John M. (2001). A Dictionary of Epidemiology (4 ed.). Oxford University Press. Selection bias - p. 166. ISBN 978-0-19-514169-6.

[Lexitron-5] sampling = [N] การสุ่มตัวอย่าง "Lexitron พจนานุกรมไทย<=>อังกฤษ รุ่น 2.6". หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา, ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, กระทรวงวิทยาศาสตร์และเทคโนโลยี. 2546.

[6] "Medical Dictionary - 'Sampling Bias'". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 10 March 2016. สืบค้นเมื่อ 23 September 2009.

[7] Mosby's Medical Dictionary, 8th edition อ้างอิงโดย "TheFreeDictionary → biased sample". สืบค้นเมื่อ 23 September 2009.

[8] "Dictionary of Cancer Terms → Selection Bias". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 9 June 2009. สืบค้นเมื่อ 23 September 2009.

[ArdsChung1998-9] Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. 22 (2): 103–115. doi:10.1016/S0145-2134(97)00131-2. PMID 9504213.

[CortesMohri2008-10] Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). "Sample Selection Bias Correction Theory" (PDF). Algorithmic Learning Theory. 5254: 38–53. doi:10.1007/978-3-540-87987-9_8.

[CortesMohri2014-11] Cortes, Corinna; Mohri, Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. 519: 103–126. doi:10.1016/j.tcs.2013.09.027.

[Fadem2009-12] Fadem, Barbara (2009). Behavioral Science. Lippincott Williams & Wilkins. p. 262. ISBN 978-0-7817-8257-9.

[fenstein-13] 13.0 ^13.1 Feinstein, AR; Horwitz, RI (November 1978). "A critique of the statistical evidence associating estrogens with endometrial cancer". Cancer Res. 38 (11 Pt 2): 4001–5. PMID 698947.{{cite journal}}: CS1 maint: multiple names: authors list (ลิงก์)

[14] Tamim, H; Monfared, AA; LeLorier J (March 2007). "Application of lag-time into exposure definitions to control for protopathic bias". Pharmacoepidemiol Drug Saf. 16 (3): 250–8. doi:10.1002/pds.1360. PMID 17245804.{{cite journal}}: CS1 maint: multiple names: authors list (ลิงก์)

[Dict2001-38-15] Last, John M. (2001). A Dictionary of Epidemiology (4 ed.). Oxford University Press. Confounding by indication - p.38. ISBN 978-0-19-514169-6.

[16] Matthew R. Weir (2005). Hypertension (Key Diseases) (Acp Key Diseases Series). Philadelphia, Pa: American College of Physicians. p. 159. ISBN 1-930513-58-5.

[Kruskal1960-17] Kruskal, William H. (1960). "Some Remarks on Wild Observations". Technometrics. 2 (1): 1–3. doi:10.1080/00401706.1960.10489875. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2010-01-26. สืบค้นเมื่อ 6 May 2015.

[Juni-18] 18.0 ^18.1 doi:10.1093/ije/dyh406
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand

[19] Bostrom, Nick (2002). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. ISBN 0-415-93858-9.

[20] :10.1111/j.1539-6924.2010.01460.x
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand

[21] :10.1038/438754a
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand

[22] :10.2307/1912352
This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]