ความลำบากใจของนักโทษ

จากวิกิพีเดีย สารานุกรมเสรี

ความลำบากใจของนักโทษ (อังกฤษ: prisoner's dilemma) เป็นปัญหาพื้นฐานในทฤษฎีเกมซึ่งแสดงให้เห็นว่าเหตุใดคนสองคนจึงอาจไม่ร่วมมือกันแม้ว่าทั้งสองจะได้รับผลประโยชน์มากที่สุดในการร่วมมือกันนั้น เดิมปัญหาดังกล่าวคิดขึ้นโดยเมอร์ริลล์ ฟลัด และเมลวิน เดรชเชอร์ ซึ่งกำลังทำงานอยู่ที่ RAND ในปี ค.ศ. 1950 อัลเบิร์ต ดับเบิลยู. ทักเกอร์ทำให้เกมดังกล่าวเป็นระเบียบแบบแผนด้วยการกำหนดโทษจำคุกและให้ชื่อว่า "ความลำบากใจของนักโทษ"

ตัวอย่างคลาสสิกของความลำบากใจของนักโทษมีดังนี้

ผู้ต้องสงสัยสองคนถูกตำรวจจับกุม ตำรวจมีหลักฐานไม่เพียงพอที่จะพิสูจน์ว่ามีความผิด ตำรวจแยกผู้ต้องสงสัยทั้งคู่ออกจากกัน และเสนอข้อเสนอเดียวกันแก่ผู้ต้องสงสัยทั้งคู่ หากคนหนึ่งให้การเป็นพยานต่ออีกคนหนึ่ง (แปรพักตร์) และอีกคนหนึ่งยังคงไม่ให้การ (ร่วมมือ) ผู้แปรพักตร์จะถูกปล่อยตัวไปแต่ผู้สมคบคิดที่ไม่ให้การจะได้รับโทษจำคุกเต็มหนึ่งปี หากทั้งคู่ไม่ให้การ นักโทษทั้งสองจะถูกตัดสินจำคุกเพียงหนึ่งเดือนด้วยข้อหาเล็กน้อย หากทั้งสองให้การ แต่ละคนจะได้รับโทษสามเดือน นักโทษแต่ละคนต้องเลือกที่จะทรยศอีกฝ่ายหนึ่งหรือปฏิเสธที่จะให้การ แต่ละคนต่างก็รู้ว่าอีกฝ่ายหนึ่งไม่อาจรู้ได้ถึงการทรยศก่อนการสืบสวนจะสิ้นสุด นักโทษควรทำอย่างไร

หากผู้เล่นแต่ละคนต่างสนใจลดเวลาในการถูกจำคุกลงให้เหลือน้อยที่สุด เช่นนั้นแล้วความลำบากใจของนักโทษก็จะเป็นเกมที่มีผลรวมไม่เป็นศูนย์ซึ่งผู้เล่นทั้งสองอาจร่วมมือกันหรือแปรพักตร์จากผู้เล่นอีกคนหนึ่ง ในเกมนี้ เช่นเดียวกับทฤษฎีเกมส่วนมาก ผู้เล่นแต่ละคน (นักโทษ) ต่างก็ต้องการให้ตนเองได้รับผลประโยชน์มากที่สุด โดยไม่คำนึงถึงผลประโยชน์ของผู้เล่นอีกคนหนึ่ง สมดุลเฉพาะของเกมนี้คือ สภาวะเลวกว่าอุตมภาพแบบพาเรโต (Pareto-suboptimal solution) นั่นคือ ทางเลือกนำให้ผู้เล่นทั้งสองเลือกที่จะแปรพักตร์ทั้งคู่ ถึงแม้ว่าผู้เล่นแต่ละคนจะได้รับผลประโยชน์มากกว่าหากทั้งสองรวมมือกัน

ในรูปแบบคลาสสิกของเกมนี้ การแปรพักตร์เป็นกลยุทธ์เด่นเหนือกว่าการร่วมมือกัน ดังนั้นสมดุลที่เป็นไปได้ของเกมนี้คือผู้เล่นทุกคนเลือกจะแปรพักตร์ ไม่ว่าผู้เล่นอีกฝ่ายจะเลือกอะไร แต่ผู้เล่นจะได้รับผลประโยชน์สูงสุดโดยการเลือกแปรพักตร์ เพราะว่าในสถานการณ์ใด ๆ การเลือกแปรพักตร์ได้ประโยชน์มากกว่าจะร่วมมือกัน ผู้เล่นทุกคนจึงเลือกแปรพักตร์ และผลที่ได้ก็จะออกมาเท่ากัน

กลยุทธ์สำหรับความลำบากใจของนักโทษคลาสสิก[แก้]

ความลำบากใจของนักโทษแบบคลาสสิกสามารถสรุปได้ดังนี้

นักโทษ ข ปฏิเสธจะให้การ (ร่วมมือ) นักโทษ ข สารภาพ (แปรพักตร์)
นักโทษ ก ปฏิเสธจะให้การ (ร่วมมือ) ทั้งสองรับโทษ 1 เดือน นักโทษ ก: 1 ปี
นักโทษ ข: ปล่อยตัวเป็นอิสระ
นักโทษ ก สารภาพ (แปรพักตร์) นักโทษ ก: ปล่อยตัวเป็นอิสระ
นักโทษ ข: 1 ปี
ทั้งสองรับโทษ 3 เดือน

ลองจินตนาการดูว่าคุณเป็นผู้เล่น ก หากผู้เล่น ข ตัดสินใจปฏิเสธจะให้การเกี่ยวกับอาชญากรรม คุณก็จะได้ผลประโยชน์มากกว่าหากคุณสารภาพ เพราะคุณจะถูกปล่อยตัวเป็นอิสระ เช่นเดียวกัน หากผู้เล่น ข สารภาพ คุณก็จะได้รับผลประโยชน์มากกว่าถ้าคุณสารภาพ เพราะคุณจะได้รับโทษเพียง 3 เดือน แทนที่จะเป็น 1 ปี จากมุมมองนี้ ไม่ว่าผู้เล่น ข จะเลือกอะไร ผู้เล่น ก ก็จะได้รับผลประโยชน์มากกว่าถ้าสารภาพ มีผู้กล่าวว่าการสารภาพ (แปรพักตร์) เป็นกลยุทธ์เด่นของเกมนี้

หากคุณเป็นนักโทษ ก คุณสามารถกล่าวได้ว่า "ไม่ว่านักโทษ ข จะเลือกอย่างไร ผม/ดิฉันก็จะได้เปรียบถ้าจะสารภาพกว่าเลือกที่จะไม่ให้การ ดังนั้น เพื่อเห็นแก่ตัวผม/ดิฉันเอง ผม/ดิฉันควรจะสารภาพ" อย่างไรก็ตาม หากผู้เล่นอีกคนหนึ่งทำแบบเดียวกัน คือ ทั้งสองคนเลือกจะสารภาพ แล้วทั้งสองก็จะได้รับโทษมากกว่าที่คุณและอีกฝ่ายหนึ่งจะได้รับหากเลือกที่จะไม่ให้การทั้งคู่ นั่นคือ การตัดสินใจที่ดูเหมือนว่าจะให้ประโยชน์แก่ตนเองมากที่สุดกลับไม่ได้ให้ผลประโยชน์ที่ดีที่สุด ดังนั้นจึงกลายเป็นที่มาของความลำบากใจ ในทฤษฎีเกมนี้เป็นตัวอย่างเกมที่มีผลรวมไม่เป็นศูนย์ว่า สมดุลของแนชไม่จำเป็นจะต้องเป็นอุตมภาพของพาเรโต

แต่แม้ว่าพวกเขาไม่ได้รับอนุญาตให้สื่อสารระหว่างกัน หากนักโทษต่างก็เชื่อมั่นในตัวอีกฝ่าย ทั้งสองก็สามารถเลือกที่จะไม่ให้การได้ ซึ่งจะลดโทษแก่พวกเขาทั้งสอง

รูปแบบทั่วไป[แก้]

รูปแบบทั่วไปของเกมได้ถูกใช้บ่อยครั้งในเศรษฐศาสตร์ทดลอง ตัวอย่างเกมเป็นดังนี้

มีผู้เล่นสองคนกับนายธนาคาร ผู้เล่นแต่ละคนมีไพ่คนละสองใบ ใบหนึ่งมีคำว่า "ร่วมมือ" ส่วนอีกใบหนึ่งมีคำว่า "แปรพักตร์" ผู้เล่นแต่ละคนหมอบไพ่หนึ่งใบไว้ตรงหน้านายธนาคาร ผู้เล่นแต่ละฝ่ายไม่มีโอกาสรู้ล่วงหน้าเลยว่าอีกฝ่ายหนึ่งหมอบไพ่อะไร (อันที่จริงเปิดไพ่ก็ไม่ได้มีผลกระทบต่อการวิเคราะห์กลยุทธ์เด่นแต่อย่างใด) ในตอนท้ายของรอบ นายธนาคารหงายหน้าไพ่ทั้งคู่และจ่ายค่าตอบแทนตามนั้น

กำหนดให้มีผู้เล่นสองคน "แดง" และ "น้ำเงิน" หากผู้เล่นแดงแปรพักตร์และผู้เล่นน้ำเงินร่วมมือ ผู้เล่นแดงจะได้รับผลประโยชน์จากการแปรพักตร์นั้น 5 แต้ม ขณะที่ผู้เล่นน้ำเงินได้รับผลประโยชน์ 0 แต้ม หากผู้เล่นทั้งสองร่วมมือกันจะได้รับรางวัลแห่งความร่วมมือคนละ 3 แต้ม หากผู้เล่นทั้งสองแปรพักตร์ ทั้งสองจะได้รับผลประโยชน์เพียงคนละ 1 แต้ม ตารางผลลัพธ์เป็นดังนี้

ตัวอย่างตารางผลได้
ร่วมมือ แปรพักตร์
ร่วมมือ 3, 3 0, 5
แปรพักตร์ 5, 0 1, 1

หากจำกัดความด้วยคำว่า "แพ้" หรือ "ชนะ" ตารางจะดูเหมือนแบบนี้

ร่วมมือ
แปรพักตร์
ร่วมมือ
ชนะ-ชนะ
แพ้มากกว่า-ชนะมากกว่า
แปรพักตร์
ชนะมากกว่า-แพ้มากกว่า
แพ้-แพ้