ทฤษฎีเกม

จากวิกิพีเดีย สารานุกรมเสรี
ไปยังการนำทาง ไปยังการค้นหา

ทฤษฎีเกม เป็นสาขาคณิตศาสตร์ประยุกต์ที่ศึกษาการตัดสินใจของผู้ตัดสินใจหลายฝ่าย โดยที่ผลที่แต่ละฝ่ายได้รับขึ้นอยู่กับการตัดสินใจของผู้เล่นฝ่ายอื่นๆ เกมในทางทฤษฎีเกมหมายถึงสถานการณ์ใดๆ ที่ผู้ตัดสินใจ (เรียกว่าผู้เล่น) หลายฝ่ายมีปฏิสัมพันธ์กัน ซึ่งอาจหมายถึงเกมในความหมายทั่วไป เช่น เป่ายิ้งฉุบหรือหมากรุก หรือหมายถึงสถานการณ์ทางสังคมหรือทางธรรมชาติอื่นๆ ทฤษฎีเกมได้รับการนำไปประยุกต์ใช้ในสาขาสังคมศาสตร์ต่างๆ โดยเฉพาะอย่างยิ่งเศรษฐศาสตร์ และในสาขาชีววิทยาวิวัฒนาการและวิทยาการคอมพิวเตอร์ด้วย

การศึกษาทางทฤษฎีเกมเป็นการศึกษาการตัดสินใจของผู้เล่นที่ตัดสินใจแบบ "เป็นเหตุเป็นผล" ซึ่งหมายถึงการที่ผู้เล่นตัดสินใจโดยมีเป้าหมายที่ชัดเจนและตัดสินใจตามเป้าหมายของตนเองอย่างไม่ผิดพลาด สาขาทฤษฎีเกมในรูปแบบปัจจุบันมักถือกันว่ามีจุดเริ่มต้นจากงานของจอห์น ฟอน นอยมันน์ และออสการ์ มอร์เกินสเติร์น โดยมีผลงานสำคัญคือหนังสือ "ทฤษฎีว่าด้วยเกมและพฤติกรรมทางเศรษฐกิจ" ที่ตีพิมพ์ในปี 1944 ผลงานของจอห์น แนชในการนิยามและพิสูจน์ทฤษฎีบทเกี่ยวกับสมดุลแบบแนช ซึ่งเป็นผลลัพธ์ของเกมที่ผู้เล่นแต่ละฝ่ายไม่มีแรงจูงใจที่จะเปลี่ยนการตัดสินใจของตนเอง เป็นปัจจัยที่สำคัญที่ทำให้นักวิชาการสาขาต่างๆ สามารถนำวิชาทฤษฎีเกมไปใช้ประยุกต์อย่างแพร่หลาย

ทฤษฎีเกมเป็นเครื่องมือสำคัญของทฤษฎีเศรษฐศาสตร์กระแสหลักในปัจจุบัน นักทฤษฎีเกมหลายคนจึงได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ เริ่มจาก จอห์น แนช, ไรน์ฮาร์ด เซลเทน และจอห์น ฮาร์ชาญี ในปี 1994

แนวคิดพื้นฐานของทฤษฎีเกม[แก้]

ในทางทฤษฎีเกม "เกม" หมายถึงสถานการณ์ใดๆ ที่มีผู้ตัดสินใจตั้งแต่สองฝ่ายขึ้นไป โดยผู้ตัดสินใจแต่ละฝ่ายมีเป้าหมายของตนเองและผลลัพธ์ที่แต่ละฝ่ายได้รับขึ้นอยู่กับการตัดสินใจของทุกฝ่าย[1]:1-2 ผู้ตัดสินใจแต่ละฝ่ายในเกมเรียกว่า "ผู้เล่น" โดยผู้เล่นนี้เป็นองค์ประกอบพื้นฐานของเกมในทฤษฎีเกมทุกประเภท[2]:2 ทฤษฎีเกมตั้งข้อสมมติว่าผู้เล่นทุกฝ่ายตัดสินใจ "อย่างมีเหตุผล" ซึ่งหมายถึงการที่ผู้เล่นแต่ละฝ่ายมีเป้าหมายความต้องการของตัวเองที่ชัดเจนซึ่งมักแสดงในรูปของฟังก์ชันอรรถประโยชน์ และตัดสินใจโดยเลือกทางเลือกที่ทำให้ตัวเองได้รับอรรถประโยชน์สูงสุด[1]:2[2]:4 ทฤษฎีเกมจึงมีความคล้ายกันกับทฤษฎีการตัดสินใจที่ศึกษาการตัดสินใจของผู้ตัดสินใจรายเดียว แต่แตกต่างกันที่ทฤษฎีเกมศึกษาการตัดสินใจในสถานการณ์ที่การตัดสินใจหลายฝ่ายส่งผลซึ่งกันและกัน[1]:1 ในการประยุกต์ทฤษฎีเกมในสาขาต่างๆ ผู้เล่นในเกมอาจใช้หมายถึงปัจเจกบุคคล แต่ก็อาจใช้หมายถึงกลุ่มบุคคล เช่น บริษัท รัฐบาล ไปจนถึงสิ่งอื่นๆ ที่ไม่ใช่มนุษย์ เช่น สัตว์ พืช[3] พระเป็นเจ้า[4] เป็นต้น

การวิเคราะห์ทางทฤษฎีเกมมักกำหนดว่าผู้เล่นแต่ละฝ่ายมีฟังก์ชันอรรถประโยชน์แบบฟอน นอยมันน์–มอร์เกินสเติร์น ซึ่งมีลักษณะสำคัญคือ หากว่าผลลัพธ์ของการตัดสินใจมีความเป็นไปได้หลายทางและไม่แน่นอนว่าจะได้รับผลลัพธ์ใด ผู้เล่นนั้นจะตัดสินใจในลักษณะที่ให้ได้ค่าคาดหมายของฟังก์ชันอรรถประโยชน์นั้นสูงสุด[2]:5[5]:9

ทฤษฎีเกมแบบร่วมมือและแบบไม่ร่วมมือ[แก้]

ทฤษฎีเกมสามารถแบ่งออกได้เป็นสองสาขาใหญ่ๆ ได้แก่ ทฤษฎีเกมแบบร่วมมือ (cooperative game theory) และทฤษฎีเกมแบบไม่ร่วมมือ (non-cooperative game theory) แต่ละสาขาของทฤษฎีเกมมีแนวทางการศึกษาที่แตกต่างกันในด้านรูปแบบการนิยามเกมและแนวคิดที่ใช้ในการวิเคราะห์ การจำแนกทฤษฎีสองแบบนี้มีที่มาเริ่มแรกจากบทความของจอห์น แนช ซึ่งตีพิมพ์ในปี 1951[6][7]:1

ในสาขาทฤษฎีเกมแบบไม่ร่วมมือ นิยามของเกมจะระบุทางเลือกทั้งหมดที่ผู้เล่นแต่ละฝ่ายสามารถตัดสินใจเลือกได้ ผู้เล่นแต่ละฝ่ายตัดสินใจโดยอิสระจากกันและไม่สามารถร่วมกันทำข้อตกลงอื่นๆ ให้มีผลบังคับใช้ได้ ในทฤษฎีเกมแบบร่วมมือ จะสมมติว่าผู้เล่นแต่ละฝ่ายสามารถทำข้อตกลงใดๆ กันก็ได้ โดยจะไม่ให้ความสำคัญกับขั้นตอนการเจราจาตกลงกันระหว่างผู้เล่น แต่ให้ความสำคัญกับการวิเคราะห์กลุ่มผู้เล่นว่าผู้เล่นจะมีการจับกลุ่มร่วมกันอย่างไรและจะมีการแบ่งผลประโยชน์กันอย่างไร[8] คำว่าเกมแบบไม่ร่วมมือในที่นี้ไม่ได้หมายความว่าทฤษฎีเกมชนิดนี้ไม่สามารถใช้จำลองสถานการณ์ที่มีการ "ร่วมมือ" กันในความหมายทั่วไปว่าการตกลงกระทำเพื่อให้ได้ประโยชน์ร่วมกัน แต่การจำลองสถานการณ์ความร่วมมือหรือการเจรจาต่อรองใดๆ จะต้องระบุทางเลือกและขั้นตอนเหล่านั้นในเกมอย่างชัดเจน และข้อตกลงเหล่านั้นจะไม่มีผลบังคับใช้นอกเหนือจากตามกระบวนการที่ระบุอย่างชัดเจนในเกม[7]:4[9]

รูปแบบการนิยามเกม[แก้]

เกมแบบไม่ร่วมมือ[แก้]

เกมรูปแบบกลยุทธ์[แก้]

เกมรูปแบบกลยุทธ์ (strategic-form game) หรือเกมรูปแบบปรกติ (normal-form game) ประกอบไปด้วยการระบุผู้เล่นภายในเกม ทางเลือกของผู้เล่นแต่ละฝ่าย เรียกในทางทฤษฎีเกมว่ากลยุทธ์ และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละฝ่าย

ในกรณีที่เกมมีผู้เล่นสองฝ่าย และแต่ละฝ่ายมีทางเลือกจำนวนจำกัด เกมนั้นสามารถเขียนออกมาได้ในรูปของตารางโดยให้แต่ละแถวในตารางหมายถึงทางเลือกของผู้เล่นฝ่ายหนึ่ง และแต่ละสดมภ์หมายถึงทางเลือกของผู้เล่นอีกฝ่ายหนึ่ง ช่องของตารางแต่ละช่องระบุอรรถประโยชน์ของผู้เล่นสองฝ่ายในแต่ละกรณี[10]:5 ดังตัวอย่างการนำเสนอเกมเป่ายิ้งฉุบในรูปแบบตารางนี้[5]:78

ค้อน กรรไกร กระดาษ
ค้อน 0,0 1,-1 -1,1
กรรไกร -1,1 0,0 1,-1
กระดาษ 1,-1 -1,1 0,0

โดยทั่วไปแล้ว จำนวนทางเลือกของผู้เล่นไม่จำเป็นต้องมีจำนวนจำกัด (ตัวอย่างกรณีที่ผู้เล่นมีทางเลือกไม่จำกัดคือ ผู้ขายสินค้าสามารถตั้งราคาขายสินค้าเป็นตัวเลขใดๆ ก็ได้) หากว่าทางเลือกของผู้เล่นทุกฝ่ายมีจำนวนจำกัด ทางเลือกในกรณีนี้จะเรียกว่าเป็นกลยุทธ์แท้ เกมกลยุทธ์แท้สามารถขยายให้ผู้เล่นสามารถเลือกกำหนดความน่าจะเป็นที่จะสุ่มเลือกทางเลือกแต่ละทาง เรียกว่ากลยุทธ์ผสม ตัวอย่างเข่น ในเกมเป่ายิ้งฉุบข้างต้น จอห์น ฟอน นอยมันน์ได้เขียนถึงการใช้กลยุทธ์ผสมว่า "สามัญสำนึกจะบอกได้ว่าวิธีที่ดีที่จะเล่นเกมนี้คือการเลือกทางเลือกทั้งสามทางด้วยความน่าจะเป็นแต่ละทางเท่ากับ 1/3"[11]:144

นิยามของเกมรูปแบบกลยุทธ์สามารถเขียนได้ว่า เกมรูปแบบกลยุทธ์ประกอบไปด้วย[5]:77

 • เซตผู้เล่น
 • เซตกลยุทธ์ ของผู้เล่น แต่ละฝ่าย โดยให้ เป็นสัญลักษณ์หมายถึงผลคูณคาร์ทีเซียน
 • ฟังก์ชันอรรถประโยชน์ ที่กำหนดความสัมพันธ์จาก ไปยังค่าอรรถประโยชน์ของผู้เล่น แต่ละฝ่าย ในที่นี้ เรียกว่าเป็นโพรไฟล์กลยุทธ์ (strategy profile)

ในกรณีที่ เป็นเซตกลยุทธ์แท้ เซตกลยุทธ์ผสม สามารถนิยามเป็นเซตของการแจกแจงความน่าจะเป็นของกลยุทธ์แท้ได้ว่า[5]:146

เกมรูปแบบขยาย[แก้]

เกมรูปแบบขยาย (extensive-form game) เป็นรูปแบบการบรรยายลักษณะของเกมที่ระบุลำดับการตัดสินใจก่อนหลังของผู้เล่นแต่ละฝ่ายอย่างชัดเจน เกมรูปแบบขยายสามารถเขียนได้รูปของกราฟแบบต้นไม้ที่จุดยอดแต่ละจุด (ยกเว้นจุดยอดปลายทาง) ระบุว่าผู้เล่นฝ่ายใดตัดสินใจ และจุดปลายทางระบุว่าผู้เล่นแต่ละฝ่ายได้รับอรรถประโยชน์เท่าใด[12] อาจกล่าวได้ว่าเกมรูปแบบขยาย มีลักษณะเหมือนต้นไม้ตัดสินใจที่มีผู้ตัดสินใจหลายฝ่าย[10]:67

เกมในรูปแบบขยายสามารถใช้บรรยายสถานการณ์ที่ผู้เล่นไม่ทราบอย่างครบถ้วนว่าการตัดสินใจต่างๆ ในจุดก่อนหน้าเป็นอย่างไร โดยการแบ่งจุดตัดสินใจทั้งหมดของผู้เล่นแต่ละฝ่ายออกเป็นเซตสารสนเทศ หากว่าเซตสารสนเทศมีสมาชิกมากกว่าหนึ่งจุด หมายความว่าหากเกมดำเนินไปถึงจุดใดจุดหนึ่งในเซตนั้น ผู้เล่นรายนั้นจะไม่ทราบแน่ชัดว่ากำลังตัดสินใจที่จุดใด ทุกจุดตัดสินใจในเซตสารสนเทศเดียวกันจะมีทางเลือกแบบเดียวกัน เกมที่ผู้เล่นรู้แน่ชัดว่ากำลังตัดสินใจที่จุดใด เรียกว่าเกมที่มีสารสนเทศสมบูรณ์ (perfect information) ซึ่งหมายความว่าเซตสารสนเทศทุกเซตจะมีสมาชิกเพียงจุดยอดเดียว[5]:55

เกมรูปแบบขยายยังสามารถใช้ระบุสถานการณ์ที่มีปัจจัยภายนอกที่มีลักษณะของความเสี่ยงหรือการสุ่มด้วย (เช่น การทอยลูกเต๋า) โดยใช้วิธีการกำหนดจุดยอดบางจุดว่าเป็นของผู้เล่นที่เรียกว่า "ธรรมชาติ" ทางเลือกจากจุดของธรรมชาติคือความเป็นไปได้ที่จะเกิดขึ้นในสถานการณ์นั้น และกำหนดความน่าจะเป็นที่แต่ละทางจะเกิดขึ้น[5]:50

โดยสรุปแล้ว การนิยามเกมรูปแบบขยาย ประกอบไปด้วย[10]:77

 • เซตผู้เล่น
 • ลำดับการตัดสินใจ
 • ฟังก์ชันอรรถประโยชน์ซึ่งขึ้นกับการตัดสินใจทั้งหมดของผู้เล่นทุกฝ่าย
 • ทางเลือกของผู้เล่นในแต่ละจุดที่ตัดสินใจ
 • สิ่งที่ผู้เล่นทราบในแต่ละจุดที่ตัดสินใจ
 • การแจกแจงความน่าจะเป็นสำหรับเหตุการณ์ภายนอกที่มีลักษณะสุ่ม

เกมในรูปแบบขยาย สามารถเขียนออกมาเป็นเกมรูปแบบกลยุทธ์ได้ โดยนิยามทางเลือกของผู้เล่นแต่ละฝ่ายให้ครอบคลุมทุกรูปแบบการตัดสินใจที่เป็นไปได้ การนิยามทางเลือกในรูปแบบนี้ เปรียบได้กับการที่ผู้เล่นตัดสินใจล่วงหน้าก่อนเริ่มเกมว่าจะตัดสินใจอย่างไรบ้างที่แต่ละจุดที่ต้องตัดสินใจ[10]:85 จากตัวอย่างแผนภาพต้นไม้เกมที่สารสนเทศสมบูรณ์ ผู้เล่น 2 มีจุดที่ต้องตัดสินใจสองจุด คือตัดสินใจหลังจากผู้เล่น 1 เลือก O และตัดสินใจว่าหลังจากผู้เล่น 1 เลือก F หากเขียนเป็นเกมแบบกลยุทธ์ ผู้เล่น 2 จะมีทางเลือกสี่ทาง คือ (Oo,Fo), (Oo,Ff), (Of,Fo) และ (Of, Ff) ซึ่งเขียนออกมาเป็นเกมรูปแบบกลยุทธ์ได้ตามตารางนี้

(Oo,Fo) (Oo,Ff) (Of,Fo) (Of,Ff)
O 3,2 3,2 0,0 0,0
F 0,0 0,0 2,3 2,3

เกมแบบร่วมมือ[แก้]

การนิยามทฤษฎีเกมแบบร่วมมือ ไม่ได้นิยามในลักษณะทางเลือกในการตัดสินใจเลือกของผู้เล่นแต่ละฝ่าย แต่เป็นฟังก์ชันของกลุ่มผู้เล่น (coalition) โดยค่าของฟังก์ชันนั้นคือค่าอรรถประโยชน์หากว่าผู้เล่นในกลุ่มนั้นตกลงร่วมมือกัน การนิยามเกมในลักษณะของทฤษฎีเกมแบบร่วมมือเรียกโดยทั่วไปว่าเป็นเกมรูปแบบการจัดกลุ่ม (coalitional form) เกมลักษณะนี้แบ่งออกได้เป็นสองประเภทหลัก คือ เกมที่มีการยกอรรถประโยชน์ให้กันได้ (transferable utility) และเกมที่ไม่มีการยกอรรถประโยชน์ให้กันได้ (non-transferable utility)

ในเกมที่มีการยกอรรถประโยชน์ให้กันได้ การจับกลุ่มผู้เล่นแต่ละกลุ่มจะมีค่าอรรถประโยชน์ร่วมกันหนึ่งค่า ซึ่งสมาชิกในกลุ่มนั้นๆ จะแบ่งกันอย่างไรก็ได้ กล่าวคือ อรรถประโยชน์มีลักษณะที่ยกให้กันในอัตราส่วนคงที่ เกมในลักษณะนี้สามารถเปรียบได้ว่าอรรถประโยชน์มีลักษณะเหมือนมูลค่าที่เป็นเงินตรา[13] นิยามเกมที่มีการยกอรรถประโยชน์ให้กันได้ ประกอบไปด้วย เซตผู้เล่น และฟังก์ชันจำนวนจริงที่ระบุค่า สำหรับทุกเซตย่อย โดยแต่ละเซตย่อย ที่ไม่เป็นเซตว่างนี้ เรียกว่าเป็นกลุ่มผู้เล่น โดยทั่วไปจะกำหนดให้ค่าของเซตว่าง เท่ากับศูนย์

เกมที่ไม่มีการยกอรรถประโยชน์ให้กันได้ จะไม่สมมติว่าอรรถประโยชน์สามารถยกให้กันได้ในลักษณะหนึ่งต่อหนึ่ง โดยการนิยามเกมประเภทนี้จะระบุเซตของการแบ่งอรรถประโยชน์ที่เป็นไปได้ของแต่ละกลุ่มผู้เล่น เป็น [13]

แนวคิดผลเฉลย[แก้]

แนวคิดผลเฉลย (solution concept) หมายถึงฟังก์ชันหรือวิธีการที่ระบุผลลัพธ์จากเกมแต่ละเกม โดยนิยามของแนวคิดผลเฉลยแต่ละชนิดจะเป็นไปตามเงื่อนไขบางประการ[8]

เกมแบบไม่ร่วมมือ[แก้]

สมดุลแบบแนช[แก้]

ดูบทความหลักที่: สมดุลแบบแนช

แนวคิดสมดุลแบบแนช (Nash equilibrium; เรียกตามชื่อของจอห์น แนช) เป็นแนวคิดผลเฉลยสำคัญของทฤษฎีเกมแบบไม่ร่วมมือ หลักสำคัญของแนวคิดนี้คือ ผู้เล่นแต่ละฝ่ายเลือกทางเลือกที่ดีสุดสำหรับตนเอง เมื่อพิจารณาถึงทางเลือกของผู้เล่นอื่นในจุดสมดุลนั้นๆ[10]:11 ผู้เล่นแต่ละฝ่ายจึงไม่สามารถได้ประโยชน์มากขึ้นด้วยการเปลี่ยนทางเลือกของตัวเองแต่เพียงฝ่ายเดียวได้ในจุดสมดุล

จากนิยามของเกมรูปแบบกลยุทธ์ข้างต้น หากกำหนดให้ หมายถึงโพรไฟล์กลยุทธ์ของผู้เล่นทุกคนยกเว้นผู้เล่น โพรไฟล์กลยุทธ์ สามารถเขียนได้ในอีกรูปแบบหนึ่งเป็น

โพร์ไฟล์กลยุทธ์ ถือว่าเป็นจุดสมดุลแบบแนช ถ้ากลยุทธ์ ที่ผู้เล่น เลือก เป็นกลยุทธ์ที่ให้อรรถประโยชน์สูงสุดแก่ผู้เล่น เมื่อผู้เล่นคนอื่นๆ เลือกเล่นกลยุทธ์ที่ระบุใน กล่าวอีกทางหนึ่งคือ ผู้เล่นแต่ละคนในเกมไม่สามารถทำให้อรรถประโยชน์ของตัวเองสูงขึ้นด้วยการเลือกกลยุทธ์อื่นที่ไม่ใช่ ตราบใดที่ผู้เล่นคนอื่นทุกคนเลือกกลยุทธ์ของตัวเองตามที่กำหนดในโพรไฟล์กลยุทธ์ เงื่อนไขนี้เขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ได้ว่า[10]:11[5]:96

เกมบางเกมอาจไม่มีจุดสมดุลแบบแนชในกลยุทธ์แท้ ผลงานสำคัญของแนชคือการพิสูจน์ว่า เกมทุกเกมจะมีจุดสมดุลลักษณะนี้ในกลยุทธ์แบบผสมอย่างน้อยหนึ่งจุดเสมอ แนชพิสูจน์ทฤษฎีบทนี้โดยการใช้ทฤษฎีบทจุดตรึง[10]:29 แนวทางการพิสูจน์ด้วยทฤษฎีบทจุดตรึงนี้สามารถพิสูจน์ทฤษฎีบทที่มีนัยทั่วไปกว่าทฤษฎีบทของแนชว่า หากว่าเกมมีเซตกลยุทธ์เป็นเซตย่อยของปริภูมิแบบยุคลิดที่กระชับ คอนเวกซ์ และไม่เป็นเซตว่าง และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละคนเป็นฟังก์ชันต่อเนื่องในเซตโพรไฟล์กลยุทธ์ และกึ่งเว้าต่อกลยุทธ์ของตัวเอง เกมนั้นก็จะมีจุดสมดุลแบบแนชอย่างน้อยหนึ่งจุด กล่าวได้ว่า ทฤษฎีบทของแนชเป็นกรณีเฉพาะของทฤษฎีบททั่วไปนี้[10]:34

สมดุลแบบสมบูรณ์ทุกเกมย่อย[แก้]

เกมนี้มีจุดสมดุลแบบแนชคือ (A,d) และ (B,c) แต่ (A,d) ไม่ใช่จุดสมดุลที่สมบูรณ์ในเกมย่อย

สมดุลแบบแนชเป็นแนวคิดคำตอบที่นิยามจากเกมในรูปแบบกลยุทธ์ ซึ่งสามารถนำมาใช้กับเกมที่มีการตัดสินใจเป็นลำดับก่อนหลังได้เนื่องจากสามารถเขียนเกมออกไปในรูปแบบกลยุทธ์ได้โดยเปรียบเสมือนว่าผู้เล่นแต่ละฝ่ายเลือกกลยุทธ์ของตนเองทั้งเกมก่อนที่จะเริ่มเล่นเกมจริงๆ แต่สมดุลของแนชในเกมที่มีลำดับก่อนหลังอาจมีลักษณะที่มองได้ว่าเป็นการตัดสินใจที่ไม่สมเหตุสมผล เนื่องจากผู้เล่นสามารถเลือกกลยุทธ์ที่เรียกว่า "คำขู่ที่ไม่น่าเชื่อถือ" (non-credible threat) ซึ่งมีลักษณะเหมือนกับการที่ผู้เล่นขู่ไว้ล่วงหน้าว่าจะเลือกทางที่ทำให้ตนเองเสียประโยชน์ เพื่อกดดันผู้เล่นฝ่ายอื่นที่ตัดสินใจก่อนหน้าให้เลือกทางเลือกอื่นแทน

สมดุลแบบสมบูรณ์ทุกเกมย่อย (subgame perfect equilibrium) เป็นแนวคิดคำตอบที่กำหนดว่าการตัดสินใจของผู้เล่นจะต้องเป็นจุดสมดุลแบบแนชในทุกเกมย่อย (subgame) ที่เริ่มจากจุดยอดใดๆ ในเกม จุดสมดุลแบบสมบูรณ์ทุกเกมย่อยสามารถหาได้ด้วยวิธีการนิรนัยย้อนกลับ (backward induction) ซึ่งหมายถึงการพิจารณาตัดทางเลือกที่ไม่สมเหตุสมผลจากสิ้นสุดของเกมย้อนไปหาจุดเริ่มต้นของเกม

เกมแบบร่วมมือ[แก้]

แนวทางการวิเคราะห์เกมแบบร่วมมือ มักประกอบด้วยการเลือกวิธีการจับกลุ่มของผู้เล่นหรือแบ่งผลประโยชน์ ที่เป็นไปตามเงื่อนไข (สัจพจน์) บางประการที่กำหนด เช่น ประสิทธิภาพ ความสมมาตร ความเท่าเทียม ความเสถียร เป็นต้น[13] แนวคิดผลเฉลยของเกมแบบร่วมมือ อาจมีลักษณะเป็นเซต เช่น คอร์ เซตเสถียร หรือมีลักษณะเป็นจุดเดียว เช่น ค่าแชปลีย์ นิวคลีโอลัส เป็นต้น


ประวัติ[แก้]

จอห์น ฟอน นอยมันน์
จอห์น แนช

การอภิปรายในยุคแรกถึงตัวอย่างของเกมสองผู้เล่นเกิดขึ้นนานมาแล้วก่อนการศึกษาทฤษฎีเกมทางคณิตศาสตร์สมัยใหม่ โดยพบหลักฐานที่กล่าวถึงทฤษฎีเกมเป็นครั้งแรกในจดหมายเมื่อปี พ.ศ. 2256 ซึ่งเขียนโดย เจมส์ วอลด์เกรฟ เขาได้ทำการวิเคราะห์หากลยุทธที่ดีที่สุดในการเล่นเกมไพ่ชนิดหนึ่งที่มีผู้เล่นสองคน ชื่อว่า le Her โดยใช้หลักการคล้ายกับทฤษฎีเกม ต่อมา เจมส์ แมดิสันได้วิเคราะห์ทฤษฎีเกมถึงวิธีที่รัฐจะถูกคาดหวังให้วางตัวภายใต้ระบบการเก็บภาษีที่แตกต่างกัน[14][15] และอ็องตวน-โอกุสแต็ง กูร์โน ได้ตีพิมพ์ผลงานเรื่อง Researches into the Mathematical Principles of the Theory of Wealth ใน พ.ศ. 2381 ซึ่งเป็นกรณีทั่วไปของการศึกษาของเจมส์

ทฤษฎีเกมได้มีการศึกษาเป็นสาขาเฉพาะครั้งแรกเมื่อจอห์น ฟอน นอยมันน์ตีพิมพ์ผลงานของตนในปี พ.ศ. 2473[16] และได้ตีพิมพ์ตำรา Theory of Games and Economic Behavior ที่เขียนร่วมกับ ออสการ์ มอร์เกินสเติร์น ใน พ.ศ. 2487 ซึ่งกล่าวถึงวิธีการหาทางเลือกที่สอดคล้องกันทั้งสองฝ่ายสำหรับเกมที่ต้องมีแพ้-ชนะสองผู้เล่น ในช่วงนี้ งานศึกษาทฤษฎีเกมส่วนใหญ่มุ่งศึกษาทฤษฎีเกมความร่วมมือ ซึ่งวิเคราะห์ถึงกลยุทธ์ที่เหมาะสมที่สุดสำหรับกลุ่มบุคคล โดยสันนิษฐานว่าพวกเขาสามารถตกลงในข้อตกลงระหว่างกันเกี่ยวกับกลยุทธ์ที่เหมาะสมได้[17]

ใน พ.ศ. 2493 ได้ปรากฏการอภิปรายครั้งแรกถึงปัญหา "ความลำบากใจของนักโทษ" ขึ้น ซึ่งในขณะเดียวกัน จอห์น แนชได้พัฒนาหลักเกณฑ์สำหรับความสอดคล้องกันในกลยุทธ์ของผู้เล่นทั้งสองฝ่าย ซึ่งเรียกว่า "จุดสมดุลของแนช" ซึ่งใช้ได้กับเกมหลากหลายประเภทกว่าเกณฑ์ที่เสนอโดยฟอน นอย์มันน์และมอร์เกินสเติร์น จุดสมดุลดังกล่าวเป็นเรื่องทั่วไปมากพอที่จะเปิดโอกาสให้วิเคราะห์เกมการแข่งขันนอกเหนือไปจากเกมความร่วมมือได้ จอห์น แนชได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ ร่วมกับจอห์น ฮาร์ชาญี และไรน์ฮาร์ด เซลเทน ในปี พ.ศ. 2537 ในฐานะที่เป็นผู้นำหลักทฤษฎีเกมไปประยุกต์ใช้ในด้านเศรษฐศาสตร์ และในช่วงคริสต์ศวรรษ 1970 (พ.ศ. 2513-2522) ได้มีการประยุกต์ทฤษฎีเกมเข้ากับวิชาชีววิทยา ส่วนการประยุกต์ในวิชารัฐศาสตร์และปรัชญาได้มีมาตั้งแต่คริสต์ทศวรรษ 1950 (พ.ศ. 2493-2502) แล้ว

ทฤษฎีเกมประสบกับกิจกรรมจำนวนมากในทศวรรษที่ 1950 ในช่วงที่แนวคิดเรื่องแก่นหลัก เกมรูปแบบขยาย การเล่นไม่จริง เกมซ้ำๆ และมูลค่าแชปลีย์ ถูกพัฒนาขึ้น นอกจากนี้

ใน 1979 โรเบิร์ต แอกเซลรอด พยายามที่จะสร้างโปรแกรมคอมพิวเตอร์เปรียบเสมือนกับผู้เล่นและพบว่าในการแข่งขันระหว่างกัน ผู้ชนะมักจะเป็นโปรแกรม "ตาต่อตา ฟันต่อฟัน" ที่ร่วมมือกันในขั้นตอนแรก และในระยะถัดมาจะทำในสิ่งที่คู่ต่อสู้ทำในระยะก่อนหน้าทุกครั้ง

ความสำเร็จในด้านการชนะรางวัลต่างๆ[แก้]

ในปี 1965 ไรน์ฮาร์ด เซลเทนได้ริเริ่มแนวคิดของผลลัพธ์ที่เรียกว่าดุลยภาพสมบูรณ์ของเกมย่อย ซึ่งต่อมาได้เป็นการปัดฝุ่นคำว่าดุลยภาพของแนชขึ้นมาใหม่ (ต่อมาเขาได้ริเริ่มดุลยภาพสมบูรณ์ของภาวะสั่นไหวของมือขึ้นมาอีกเช่นกัน) ในปี 1994 แนช เซลเทน และฮาร์ชาญี ได้เป็นผู้ชนะรางวัลโนเบลสาขาเศรษฐศาสตร์สำหรับงานที่เกี่ยวกับทฤษฎีเกมทางเศรษฐศาสตร์

ในทศวรรษ 1970 ได้มีการประยุกต์ทฤษฎีเกมเข้ากับวิชาชีววิทยา โดยส่วนใหญ่เป็นผลงานของจอห์น เมนาร์ด สมิธ และกลยุทธ์วิวัฒนาการอย่างคงที่ นอกจากนี้ แนวคิดของดุลยภาพสหสัมพันธ์ ภาวะสมบูรณ์ของภาวะการสั่นไหวของมือ และความรู้ร่วม ถูกนำมาใช้และวิเคราะห์

ในปี 2005 นักทฤษฎีเกม โทมัส เชลลิง และโรเบิร์ต ออมันน์ ได้รับรางวัลโนเบลต่อจากแนช เซลเทน และฮาร์ชาญี โดยเชลลิงศึกษาทางด้านแบบจำลองพลวัต ซึ่งเป็นตัวอย่างแรกๆ ของทฤษฎีเกมเชิงวิวัฒนาการ ออมันน์เน้นศึกษาเกี่ยวกับดุลยภาพ ได้ริเริ่มดุลยภาพแบบหยาบ ดุลยภาพสหสัมพันธ์ และพัฒนาการวิเคราะห์ที่เป็นระเบียบมากขึ้นสำหรับสมมติฐานที่เกี่ยวกับความรู้ร่วมและผลที่ตามมา

ในปี 2007 เลออนิด คูร์วิช ร่วมกับเอริก มัสกิน และโรเจอร์ ไมเออร์สัน ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จาก "การวางรากฐานทฤษฎีการออกแบบกลไก" งานของไมเออร์สันรวมถึงการนำเสนอดุลยภาพที่เหมาะสม และหนังสือระดับปริญญาโทที่สำคัญ Game Theory, Analysis of Conflict ส่วนฮัวร์วิกซ์ริเริ่มและทำแนวคิดของแรงจูงใจที่สอดคล้องกันให้เป็นรูปเป็นร่างมากขึ้น

ในปี 2012 อัลวิน รอธ และ ลอยด์ แชปลีย์ ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ "สำหรับทฤษฎีการจัดสรรอย่างคงที่และการใช้การออกแบบตลาด" และในปี 2014 รางวัลโนเบลได้มอบแก่นักทฤษฎีเกม ฌ็อง ตีโรล

ตัวอย่างเกมที่มีชื่อเสียง[แก้]

เกมความลำบากใจของนักโทษ[แก้]

เกมความลำบากใจของนักโทษ (Prisoner's dilemma) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง แนวคิดของเกมนี้ได้สร้างขึ้นโดย เมอร์ริล ฟลูด และ เมลวิน เดรชเชอร์ ใน พ.ศ. 2493 โดยมีลักษณะเป็นเกมที่ผู้เล่นทั้งสองฝ่ายพยายามเลือกทางเลือกที่ได้ผลตอบแทนมากที่สุด แต่กลับทำให้ผลตอบแทนรวมที่ได้ต่ำลง มีสถานการณ์ดังนี้

คนร้ายสองคนคือ A และ B ถูกตำรวจจับและถูกแยกไปสอบปากคำทีละคน ตำรวจไม่สามารถดำเนินคดีกับคนร้ายทั้งสองได้ทันทีเพราะไม่มีพยาน คนร้ายแต่ละคนมีทางเลือกสองทางคือ รับสารภาพ และไม่รับสารภาพ ถ้าคนร้ายคนหนึ่งรับสารภาพแต่อีกคนไม่รับ ตำรวจจะกันคนที่รับสารภาพไว้เป็นพยานและปล่อยตัวไป และจะส่งฟ้องคนที่ไม่รับสารภาพซึ่งมีโทษจำคุก 20 ปี ถ้าทั้งสองคนรับสารภาพ จะได้รับการลดโทษเหลือจำคุกคนละ 10 ปี แต่ถ้าทั้งสองคนไม่รับสารภาพ ตำรวจจะสามารถส่งฟ้องได้เพียงข้อหาเล็กน้อยเท่านั้นซึ่งมีโทษจำคุก 1 ปี

เกมนี้สามารถเขียนแสดงในรูปแบบตารางได้ดังนี้

รับสารภาพ ไม่รับสารภาพ
รับสารภาพ -10, -10 0, -20
ไม่รับสารภาพ -20, 0 -1, -1

จะเห็นว่ากลยุทธเด่นของผู้เล่นทั้งสองฝ่ายคือการรับสารภาพ เพราะไม่ว่าผู้เล่นอีกฝ่ายจะตัดสินใจอย่างไร ก็จะได้ผลตอบแทนที่ดีกว่าเสมอ แต่เมื่อทั้งสองฝ่ายเลือกทางเลือกนี้ กลับไม่ให้ผลตอบแทนที่ดีที่สุด ถึงแม้ผู้เล่นจะทราบว่าผลตอบแทนที่ดีที่สุดจะเกิดขึ้นเมื่อทั้งสองฝ่ายไม่รับสารภาพ แต่ทั้งคู่อาจไม่กล้าทำเพราะไม่ไว้ใจอีกฝ่ายว่าจะรับสารภาพหรือไม่ จึงทำให้ทั้งสองฝ่ายต้องได้รับผลตอบแทนที่ต่ำลง และจุด (-10, -10) ก็เป็นจุดสมดุลของแนชในเกมนี้ เพราะผู้เล่นทั้งสองฝ่ายไม่สามารถเปลี่ยนไปเลือกทางเลือกอื่นที่ได้ผลตอบแทนดีกว่านี้

เกมไก่ตื่น[แก้]

เกมไก่ตื่น (Chicken) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง มีสถานการณ์ดังนี้

ผู้เล่นสองคนขับรถด้วยความเร็วสูงเข้าหากัน ฝ่ายที่หักหลบรถก่อนจะเป็นผู้แพ้ แต่ถ้าผู้เล่นทั้งสองฝ่ายไม่หักหลบรถ รถจะชนกันและจะทำให้ผู้เล่นทั้งสองฝ่ายเกิดความเสียหายอย่างมาก

เกมนี้สามารถเขียนแสดงในรูปแบบตารางได้ดังนี้

หลบ ไม่หลบ
หลบ 0, 0 -1, +1
ไม่หลบ +1, -1 -10, -10

จะเห็นว่าเกมในรูปแบบนี้ไม่มีกลยุทธเด่น และมีจุดสมดุลของแนชสองจุดคือ (-1, +1) และ (+1, -1) แต่วิธีทางจิตวิทยาสำหรับผู้เล่นเกมนี้คือ พยายามส่งสัญญาณให้ผู้เล่นฝ่ายตรงข้ามเห็นว่า ตนจะไม่หักหลบอย่างแน่นอน ซึ่งจะทำให้ผู้เล่นฝ่ายตรงข้ามต้องยอมหักหลบไปเอง มิฉะนั้นจะเสียผลตอบแทนอย่างมาก

เกมแห่งความร่วมมือ[แก้]

เกมแห่งความร่วมมือ (Stag hunt) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง ซึ่งเป็นทางเลือกระหว่างทางที่ปลอดภัยกับการให้ความร่วมมือกับอีกฝ่าย มีสถานการณ์ดังนี้

ผู้เล่นสองคนต้องการเลือกล่าสัตว์ชนิดหนึ่งระหว่างกวางกับกระต่าย ซึ่งกวางมีราคาดีกว่ากระต่ายมาก แต่ก็ล่ายากกว่าเช่นกัน จำเป็นต้องใช้สองคนร่วมมือกันจึงจะล่าได้ ในขณะที่กระต่ายมีราคาต่ำแต่ล่าได้ง่าย สามารถล่าได้โดยใช้เพียงคนเดียว

เกมนี้สามารถเขียนแสดงในรูปแบบตารางได้ดังนี้

ล่ากวาง ล่ากระต่าย
ล่ากวาง +10, +10 0, +3
ล่ากระต่าย +3, 0 +3, +3

จะเห็นว่าเกมในรูปแบบนี้ไม่มีกลยุทธเด่น และมีจุดสมดุลของแนชสองจุดคือ (+10, +10) และ (+3, +3) ซึ่งการที่ผู้เล่นทั้งสองจะได้ผลตอบแทนสูงสุดนั้น จะต้องอาศัยความร่วมมือร่วมใจกัน คือเลือกล่ากวางทั้งคู่ ซึ่งผู้เล่นจะต้องมีความไว้วางใจผู้เล่นอีกฝ่ายด้วย

การประยุกต์ใช้[แก้]

รัฐศาสตร์[แก้]

มีการนำทฤษฎีเกมมาประยุกต์ใช้ในด้านรัฐศาสตร์ เช่น การหาเสียงเลือกตั้ง ในปี พ.ศ. 2500 แอนโทนี ดาวน์ส ได้ตีพิมพ์ผลงานเรื่อง An Economic Theory of Democracy ซึ่งมีเนื้อหาเกี่ยวกับการเลือกตำแหน่งในการหาเสียงเลือกตั้งให้ได้ผลดีที่สุด

เศรษฐศาสตร์[แก้]

ในทางเศรษฐศาสตร์ ได้มีการนำทฤษฎีเกมมาช่วยในการตัดสินใจในหลาย ๆ ด้านมาเป็นเวลานานแล้ว เช่น การต่อรองผลประโยชน์ การประมูล การแข่งขันของผู้ผลิต การรวมกลุ่มทางเศรษฐกิจ โดยมีแนวคิดสำคัญที่ใช้คือเรื่องจุดสมดุลของแนช อย่างไรก็ตาม ในเกมการแข่งขันทางธุรกิจ อาจมีการปรับเปลี่ยนกลยุทธได้ตลอดเวลาเพื่อให้ได้รับผลตอบแทนที่สูงขึ้น และผลลัพธ์ที่ได้ก็จะเข้าสู่จุดสมดุลของแนช ซึ่งเป็นจุดที่ทุกฝ่ายไม่สามรถเปลี่ยนกลยุทธเพื่อให้ได้ผลตอบแทนสูงกว่านี้อีกแล้ว

ชีววิทยา[แก้]

มีการใช้ทฤษฎีเกมเพื่ออธิบายถึงปรากฏการณ์ต่าง ๆ ทางชีววิทยา เช่น ในปี พ.ศ. 2473 โรนัลด์ ฟิชเชอร์ ได้ใช้ทฤษฎีเกมในการอธิบายถึงอัตราส่วนของสัตว์เพศผู้ต่อเพศเมียที่เป็น 1:1 เนื่องจากเป็นอัตราส่วนที่สามารถสืบพันธุ์ได้จำนวนมากที่สุด นอกจากนี้ นักชีววิทยายังใช้ทฤษฎีเกมเพื่อช่วยในการศึกษาพฤติกรรมต่าง ๆ ของสัตว์ เช่น การใช้เกมไก่ตื่นในการอธิบายถึงการต่อสู้ของสัตว์

วิทยาการคอมพิวเตอร์[แก้]

มีการพัฒนาในด้านวิทยาการคอมพิวเตอร์และการเขียนโปรแกรมเพื่อหาขั้นตอนวิธีที่ดีที่สุดในการเล่นเกมในสถานการณ์หนึ่งเป็นระยะเวลานาน

สังคมวิทยา[แก้]

ได้มีการนำทฤษฎีเกมมาประยุกต์ใช้ในด้านสังคมวิทยา เช่น วิลลาร์ด แวน ออร์มาน ควินท์ และ เดวิด ลูอิส ได้พัฒนาการศึกษาด้านประเพณีนิยม และมีการวิเคราะห์เกี่ยวกับเกมต่าง ๆ ที่ต้องเลือกระหว่างศีลธรรมกับผลประโยชน์ของตนเอง เช่น เกมความลำบากใจของนักโทษ

ในวัฒนธรรมร่วมสมัย[แก้]

 • ชีวิตของนักทฤษฎีเกมและนักคณิตศาสตร์ จอห์น แนช ได้ถูกนำมาสร้างเป็นหนังอิงชีวประวัติในปี 2001 ในชื่อ A Beautiful Mind โดยอิงจากหนังสือปี 1998 โดยซิลเวียร์ นาซาร์ นำแสดงโดยรัสเซลล์ โครว์ที่เล่นเป็นแนช
 • ในปี 1959 นวนิยายวิทยาศาสตร์สงคราม Starship Troopers โดย โรเบิร์ต เอ ไฮน์ไลน์ ได้อ้างถึง "ทฤษฎีเกม" และ "ทฤษฎีแห่งเกม" ในภาพยนตร์เรื่องเดียวกันในปี 1997 ตัวละครที่ชื่อ คาร์ล เจนกินส์ ได้อ้างถึงงานด้านการข่าวกรองทางการทหารนี้ว่าเป็นการมอบหมายงานด้าน "เกมและทฤษฎี"

อ้างอิง[แก้]

 1. 1.0 1.1 1.2 Myerson, Roger B. (1991). Game theory: Analysis of conflict. Cambridge, Massachusetts: Harvard University Press. ISBN 0-674-34116-3.
 2. 2.0 2.1 2.2 Osborne, Martin J.; Rubinstein, Ariel (1994). A course in game theory. Cambridge, Massachusetts: MIT Press. ISBN 0-262-65040-1.
 3. Falster, Daniel S.; Westoby, Mark (2003). "Plant height and evolutionary games". Trends in Ecology & Evolution. 18 (7): 337–343. doi:10.1016/S0169-5347(03)00061-2.
 4. Brams, Steven J. (1980). Biblical games: A strategic analysis of stories in the Old Testament. MIT Press. ISBN 9780262021449.
 5. 5.0 5.1 5.2 5.3 5.4 5.5 5.6 Maschler, Michael; Solan, Eilon; Zamir, Shmuel (2013). Game theory. Translated by Hellman, Ziv. Cambridge: Cambridge University Press. ISBN 978-1-107-00548-8.
 6. Nash, John (1951). "Non-cooperative games". Annals of Mathematics. 54 (2): 286–295. ISSN 0003-486X. JSTOR 1969529.
 7. 7.0 7.1 Harsanyi, John C.; Selten, Reinhard (1988). A general theory of equilibrium selection in games. Cambridge, Massachusetts: MIT Press. ISBN 0-262-08173-3.
 8. 8.0 8.1 Aumann, R.J. (2008). "Game theory". New Palgrave dictionary of economics. London: Palgrave Macmillan. doi:10.1057/978-1-349-95121-5_942-2. ISBN 978-1-349-95121-5.
 9. van Damme, Eric (2015). "Game theory: Noncooperative games". In Wright, James D. International encyclopedia of the social & behavioral sciences. 9 (2 ed.). Oxford: Elsevier. pp. 582–591. doi:10.1016/B978-0-08-097086-8.71048-8. ISBN 978-0-08-097087-5.
 10. 10.0 10.1 10.2 10.3 10.4 10.5 10.6 10.7 Fudenberg, Drew; Tirole, Jean (1991). Game theory. Cambridge, Massachusetts: MIT Press. ISBN 978-0-262-06141-4.
 11. Von Neumann, John; Morgenstern, Oskar (1953). Theory of Games and Economic Behavior (in อังกฤษ) (3 ed.). Princeton: Princeton University Press. OCLC 10006173.
 12. Hart, Sergiu (1992). "Games in extensive and strategic forms". In Aumann, Robert J.; Hart, Sergiu. Handbook of game theory with economic applications. 1. Elsevier. pp. 19–40. doi:10.1016/S1574-0005(05)80005-0.
 13. 13.0 13.1 13.2 Hokari, Toru; Thomson, William (2015). "Cooperative game theory". In Wright, James D. International encyclopedia of the social & behavioral sciences. 9 (2 ed.). Oxford: Elsevier. pp. 867–880. doi:10.1016/B978-0-08-097086-8.71073-7. ISBN 978-0-08-097087-5.
 14. James Madison, Vices of the Political System of the United States, April, 1787. Link
 15. Jack Rakove, "James Madison and the Constitution", History Now, Issue 13 September 2007. Link
 16. J. v. Neumann (1928). "Zur Theorie der Gesellschaftsspiele," Mathematische Annalen, 100(1), p p. 295-320. English translation: "On the Theory of Games of Strategy," in A. W. Tucker and R. D. Luce, ed. (1959),Contributions to the Theory of Games, v. 4, p p. 13-42.
 17. Leonard, Robert. Von Neumann, Morgenstern, and the Creation of Game Theory. Cambridge University Press, 2010

แหล่งข้อมูลอื่น[แก้]

Wikibooks-logo.svg
วิกิตำราภาษาอังกฤษ มีคู่มือ ตำรา หรือวิธีการเกี่ยวกับ: ทฤษฎีเกม