ข้ามไปเนื้อหา

ผลต่างระหว่างรุ่นของ "ทฤษฎีเกม"

จากวิกิพีเดีย สารานุกรมเสรี
เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
Portalian (คุย | ส่วนร่วม)
Kinkku Ananas (คุย | ส่วนร่วม)
ปรับโครงสร้างของบทความ แบ่งสาขา cooperative กับ non-cooperative ให้ชัดเจน เพิ่ม solution concept
บรรทัด 4: บรรทัด 4:


ทฤษฎีเกมได้ถูกพัฒนาเป็นอย่างมากในทศวรรษที่ 1950 โดยนักวิชาการหลายท่าน และมันได้ถูกนำไปประยุกต์ใช้ในชีววิทยาในช่วงทศวรรษที่ 1970 แม้ว่าอาจจะเริ่มมีการพัฒนามาตั้งแต่ในช่วงทศวรรษที่ 1930 มาก่อนหน้านี้แล้ว ทฤษฎีเกมได้รับการยอมรับว่าเป็นเครื่องมือที่สำคัญในหลายๆ สาขา โดยในปี 2014 รางวัลโนเบลในสาขาเศรษฐศาสตร์ได้มอบรางวัลให้กับนักทฤษฎีเกมที่ชื่อ ฌอง ธีโรล และมีนักทฤษฎีเกมถึงสิบเอ็ดคนที่ได้รับรางวัลในสาขานี้ และจอห์น เมนาร์ด สมิธ ได้รางวัลคราฟูลด์จากการประยุกต์ใช้ทฤษฎีเกมในชีววิทยา
ทฤษฎีเกมได้ถูกพัฒนาเป็นอย่างมากในทศวรรษที่ 1950 โดยนักวิชาการหลายท่าน และมันได้ถูกนำไปประยุกต์ใช้ในชีววิทยาในช่วงทศวรรษที่ 1970 แม้ว่าอาจจะเริ่มมีการพัฒนามาตั้งแต่ในช่วงทศวรรษที่ 1930 มาก่อนหน้านี้แล้ว ทฤษฎีเกมได้รับการยอมรับว่าเป็นเครื่องมือที่สำคัญในหลายๆ สาขา โดยในปี 2014 รางวัลโนเบลในสาขาเศรษฐศาสตร์ได้มอบรางวัลให้กับนักทฤษฎีเกมที่ชื่อ ฌอง ธีโรล และมีนักทฤษฎีเกมถึงสิบเอ็ดคนที่ได้รับรางวัลในสาขานี้ และจอห์น เมนาร์ด สมิธ ได้รางวัลคราฟูลด์จากการประยุกต์ใช้ทฤษฎีเกมในชีววิทยา

== แนวคิดพื้นฐานของทฤษฎีเกม ==

ในทางทฤษฎีเกม "เกม" หมายถึงสถานการณ์ใดๆ ที่มีผู้ตัดสินใจตั้งแต่สองฝ่ายขึ้นไป โดยผู้ตัดสินใจแต่ละฝ่ายมีเป้าหมายของตนเองและผลลัพธ์ที่แต่ละฝ่ายได้รับขึ้นอยู่กับการตัดสินใจของทุกฝ่าย{{r|Myerson|page1=1-2}} ผู้ตัดสินใจแต่ละฝ่ายในเกมเรียกว่า "ผู้เล่น" โดยผู้เล่นนี้เป็นองค์ประกอบพื้นฐานของเกมในทฤษฎีเกมทุกประเภท{{r|Osborne Rubinstein|page1=2}} ทฤษฎีเกมตั้งข้อสมมติว่าผู้เล่นทุกฝ่ายตัดสินใจ "อย่างมีเหตุผล" ซึ่งหมายถึงการที่ผู้เล่นแต่ละฝ่ายมีเป้าหมายความต้องการของตัวเองที่ชัดเจนซึ่งมักแสดงในรูปของฟังก์ชัน[[อรรถประโยชน์]] และตัดสินใจโดยเลือกทางเลือกที่ทำให้ตัวเองได้รับอรรถประโยชน์สูงสุด{{r|Myerson|page1=2|Osborne Rubinstein|page2=4}} ทฤษฎีเกมจึงมีความคล้ายกันกับ[[ทฤษฎีการตัดสินใจ]]ที่ศึกษาการตัดสินใจของผู้ตัดสินใจรายเดียว แต่แตกต่างกันที่ทฤษฎีเกมศึกษาการตัดสินใจในสถานการณ์ที่การตัดสินใจหลายฝ่ายส่งผลซึ่งกันและกัน{{r|Myerson|page1=1}} ในการประยุกต์ทฤษฎีเกมในสาขาต่างๆ ผู้เล่นในเกมอาจใช้หมายถึงปัจเจกบุคคล แต่ก็อาจใช้หมายถึงกลุ่มบุคคล เช่น บริษัท รัฐบาล ไปจนถึงสิ่งอื่นๆ ที่ไม่ใช่มนุษย์ เช่น [[สัตว์]] [[พืช]]{{r|Plant height}} [[พระเป็นเจ้า]]{{r|Biblical games}} เป็นต้น

การวิเคราะห์ทางทฤษฎีเกมมักกำหนดว่าผู้เล่นแต่ละฝ่ายมี[[ฟังก์ชันอรรถประโยชน์แบบฟอน นอยมันน์–มอร์เกินสเติร์น]] ซึ่งมีลักษณะสำคัญคือ หากว่าผลลัพธ์ของการตัดสินใจมีความเป็นไปได้หลายทางและไม่แน่นอนว่าจะได้รับผลลัพธ์ใด ผู้เล่นนั้นจะตัดสินใจในลักษณะที่ให้ได้[[ค่าคาดหมาย]]ของฟังก์ชันอรรถประโยชน์นั้นสูงสุด{{r|Osborne Rubinstein|page1=5|Maschler et al|page2=9}}

== ทฤษฎีเกมแบบร่วมมือและแบบไม่ร่วมมือ ==

ทฤษฎีเกมสามารถแบ่งออกได้เป็นสองสาขาใหญ่ๆ ได้แก่ ทฤษฎีเกมแบบร่วมมือ ({{lang|en|cooperative game theory}}) และทฤษฎีเกมแบบไม่ร่วมมือ ({{lang|en|non-cooperative game theory}}) แต่ละสาขาของทฤษฎีเกมมีแนวทางการศึกษาที่แตกต่างกันในด้านรูปแบบการนิยามเกมและแนวคิดที่ใช้ในการวิเคราะห์ การจำแนกทฤษฎีสองแบบนี้มีที่มาเริ่มแรกจากบทความของ[[จอห์น แนช]] ซึ่งตีพิมพ์ในปี 1951{{r|Nash 1951|Harsanyi Selten|page2=1}}

ในสาขาทฤษฎีเกมแบบไม่ร่วมมือ นิยามของเกมจะระบุทางเลือกทั้งหมดที่ผู้เล่นแต่ละฝ่ายสามารถตัดสินใจเลือกได้ ผู้เล่นแต่ละฝ่ายตัดสินใจโดยอิสระจากกันและไม่สามารถร่วมกันทำข้อตกลงอื่นๆ ให้มีผลบังคับใช้ได้ ในทฤษฎีเกมแบบร่วมมือ จะสมมติว่าผู้เล่นแต่ละฝ่ายสามารถทำข้อตกลงใดๆ กันก็ได้ โดยจะไม่ให้ความสำคัญกับขั้นตอนการเจราจาตกลงกันระหว่างผู้เล่น แต่ให้ความสำคัญกับการวิเคราะห์กลุ่มผู้เล่นว่าผู้เล่นจะมีการจับกลุ่มร่วมกันอย่างไรและจะมีการแบ่งผลประโยชน์กันอย่างไร{{r|Palgrave Game Theory}} คำว่าเกมแบบไม่ร่วมมือในที่นี้ไม่ได้หมายความว่าทฤษฎีเกมชนิดนี้ไม่สามารถใช้จำลองสถานการณ์ที่มีการ "ร่วมมือ" กันในความหมายทั่วไปว่าการตกลงกระทำเพื่อให้ได้ประโยชน์ร่วมกัน แต่การจำลองสถานการณ์ความร่วมมือหรือการเจรจาต่อรองใดๆ จะต้องระบุทางเลือกและขั้นตอนเหล่านั้นในเกมอย่างชัดเจน และข้อตกลงเหล่านั้นจะไม่มีผลบังคับใช้นอกเหนือจากตามกระบวนการที่ระบุอย่างชัดเจนในเกม{{r|Harsanyi Selten|page1=4|van Damme}}

== รูปแบบการนิยามเกม ==
=== เกมแบบไม่ร่วมมือ ===
==== เกมรูปแบบกลยุทธ์ ====
เกมรูปแบบกลยุทธ์ ({{lang|en|strategic-form game}}) หรือเกมรูปแบบปรกติ ({{lang|en|normal-form game}}) ประกอบไปด้วยการระบุผู้เล่นภายในเกม ทางเลือกของผู้เล่นแต่ละฝ่าย เรียกในทางทฤษฎีเกมว่ากลยุทธ์ และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละฝ่าย

ในกรณีที่เกมมีผู้เล่นสองฝ่าย และแต่ละฝ่ายมีทางเลือกจำนวน[[เซตจำกัด|จำกัด]] เกมนั้นสามารถเขียนออกมาได้ในรูปของตารางโดยให้แต่ละแถวในตารางหมายถึงทางเลือกของผู้เล่นฝ่ายหนึ่ง และแต่ละสดมภ์หมายถึงทางเลือกของผู้เล่นอีกฝ่ายหนึ่ง ช่องของตารางแต่ละช่องระบุอรรถประโยชน์ของผู้เล่นสองฝ่ายในแต่ละกรณี{{r|Fudenberg Tirole|page=5}} ดังตัวอย่างการนำเสนอเกม[[เป่ายิ้งฉุบ]]ในรูปแบบตารางนี้{{r|Maschler et al|page1=78}}

{| style="background:white; text-align:center" align=center cellspacing=0 cellpadding=8 width=350
|+
|-
!style="width:25%;|
!style="width:25%; border-bottom: solid black 1px;"|ค้อน
!style="width:25%; border-bottom: solid black 1px;"|กรรไกร
!style="width:25%; border-bottom: solid black 1px;"|กระดาษ
|-
!style="border-right: solid black 1px; | ค้อน
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 0,0
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 1,-1
|style="border-right: solid black 1px; border-bottom: solid black 1px;| -1,1
|-
!style="border-right: solid black 1px;| กรรไกร
|style="border-right: solid black 1px; border-bottom: solid black 1px;| -1,1
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 0,0
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 1,-1
|-
!style="border-right: solid black 1px;| กระดาษ
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 1,-1
|style="border-right: solid black 1px; border-bottom: solid black 1px;| -1,1
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 0,0
|}

โดยทั่วไปแล้ว จำนวนทางเลือกของผู้เล่นไม่จำเป็นต้องมีจำนวนจำกัด (ตัวอย่างกรณีที่ผู้เล่นมีทางเลือกไม่จำกัดคือ ผู้ขายสินค้าสามารถตั้งราคาขายสินค้าเป็นตัวเลขใดๆ ก็ได้) หากว่าทางเลือกของผู้เล่นทุกฝ่ายมีจำนวนจำกัด ทางเลือกในกรณีนี้จะเรียกว่าเป็นกลยุทธ์แท้ เกมกลยุทธ์แท้สามารถขยายให้ผู้เล่นสามารถเลือกกำหนดความน่าจะเป็นที่จะสุ่มเลือกทางเลือกแต่ละทาง เรียกว่ากลยุทธ์ผสม ตัวอย่างเข่น ในเกมเป่ายิ้งฉุบข้างต้น [[จอห์น ฟอน นอยมันน์]]ได้เขียนถึงการใช้กลยุทธ์ผสมว่า "สามัญสำนึกจะบอกได้ว่าวิธีที่ดีที่จะเล่นเกมนี้คือการเลือกทางเลือกทั้งสามทางด้วยความน่าจะเป็นแต่ละทางเท่ากับ {{frac|1|3}}"{{r|VonNeumann Morgenstern|page1=144}}

นิยามของเกมรูปแบบกลยุทธ์สามารถเขียนได้ว่า เกมรูปแบบกลยุทธ์ประกอบไปด้วย{{r|Maschler et al|page1=77}}
* เซตผู้เล่น <math>N = \{1, 2, \dots, n\}</math>
* เซตกลยุทธ์ <math>S_i</math> ของผู้เล่น <math>i \in N</math> แต่ละฝ่าย โดยให้ <math>S</math> เป็นสัญลักษณ์หมายถึง[[ผลคูณคาร์ทีเซียน]] <math>S_1 \times S_2 \times \dots \times S_n</math>
* ฟังก์ชันอรรถประโยชน์ <math>u_i \colon S \to \mathbb{R}</math> ที่กำหนดความสัมพันธ์จาก <math>s = (s_1, s_2, \dots, s_n)</math> ไปยังค่าอรรถประโยชน์ของผู้เล่น <math>i \in N</math> แต่ละฝ่าย ในที่นี้ <math>s</math> เรียกว่าเป็นโพรไฟล์กลยุทธ์ ({{lang|en|strategy profile}})

ในกรณีที่ <math>S_i</math> เป็นเซตกลยุทธ์แท้ เซตกลยุทธ์ผสม <math>\Sigma_i</math> สามารถนิยามเป็นเซตของ[[การแจกแจงความน่าจะเป็น]]ของกลยุทธ์แท้ได้ว่า{{r|Maschler et al|page1=146}}
<math display="block">\Sigma_i = \left\{ \sigma_i \colon S_i \to [0,1] \colon \sum_{s_i in S_i} \sigma_i (s_i) = 1 \right\}</math>

==== เกมรูปแบบขยาย ====
เกมรูปแบบขยาย ({{lang|en|extensive-form game}}) เป็นรูปแบบการบรรยายลักษณะของเกมที่ระบุลำดับการตัดสินใจก่อนหลังของผู้เล่นแต่ละฝ่ายอย่างชัดเจน โดยประกอบไปด้วย (1) ผู้เล่น (2) ลำดับการตัดสินใจ (3) ฟังก์ชันอรรถประโยชน์ซึ่งขึ้นกับการตัดสินใจทั้งหมดของผู้เล่นทุกฝ่าย (4) ทางเลือกของผู้เล่นในแต่ละจุดที่ตัดสินใจ (5) สิ่งที่ผู้เล่นทราบในแต่ละจุดที่ตัดสินใจ (6) การแจกแจงความน่าจะเป็นสำหรับเหตุการณ์ภายนอกที่มีลักษณะสุ่ม{{r|Fudenberg Tirole|page=77}}

เกมรูปแบบขยายสามารถเขียนได้รูปของ[[กราฟ (คณิตศาสตร์)|กราฟ]]แบบ[[ต้นไม้ (ทฤษฎีกราฟ)|ต้นไม้]]ที่จุดยอดแต่ละจุด (ยกเว้นจุดยอดปลายทาง) ระบุว่าผู้เล่นฝ่ายใดตัดสินใจ และจุดปลายทางระบุว่าผู้เล่นแต่ละฝ่ายได้รับอรรถประโยชน์เท่าใด{{r|Hart}} อาจกล่าวได้ว่าเกมรูปแบบขยาย มีลักษณะเหมือน[[ต้นไม้ตัดสินใจ]]ที่มีผู้ตัดสินใจหลายฝ่าย{{r|Fudenberg Tirole|page=67}}

เกมในรูปแบบขยายสามารถใช้บรรยายสถานการณ์ที่ผู้เล่นไม่ทราบอย่างครบถ้วนว่าการตัดสินใจต่างๆ ในจุดก่อนหน้าเป็นอย่างไร โดยการ[[การแบ่งกั้นเซต|แบ่ง]]จุดตัดสินใจทั้งหมดของผู้เล่นแต่ละฝ่ายออกเป็นเซตสารสนเทศ หากว่าเซตสารสนเทศมีสมาชิกมากกว่าหนึ่งจุด หมายความว่าหากเกมดำเนินไปถึงจุดใดจุดหนึ่งในเซตนั้น ผู้เล่นรายนั้นจะไม่ทราบแน่ชัดว่ากำลังตัดสินใจที่จุดใด ทุกจุดตัดสินใจในเซตสารสนเทศเดียวกันจะมีทางเลือกแบบเดียวกัน เกมที่ผู้เล่นรู้แน่ชัดว่ากำลังตัดสินใจที่จุดใด เรียกว่าเกมที่มีสารสนเทศสมบูรณ์ ({{lang|en|perfect information}}) ซึ่งหมายความว่าเซตสารสนเทศทุกเซตจะมีสมาชิกเพียงจุดยอดเดียว{{r|Maschler et al|page1=55}}

<gallery heights=148px widths=320px>
ไฟล์:Battle of the sexes - perfect information.png|เกมในรูปแบบขยายที่สารสนเทศสมบูรณ์
ไฟล์:Battle of the sexes - imperfect information.png|เกมในรูปแบบขยายที่สารสนเทศไม่สมบูรณ์ เส้นประหมายความว่าจุดยอดสองจุดอยู่ในเซตสารสนเทศเดียวกัน
</gallery>

เกมรูปแบบขยายยังสามารถใช้ระบุสถานการณ์ที่มีปัจจัยภายนอกที่มีลักษณะของความเสี่ยงหรือการสุ่มด้วย (เช่น การทอยลูกเต๋า) โดยใช้วิธีการกำหนดจุดยอดบางจุดว่าเป็นของผู้เล่นที่เรียกว่า "ธรรมชาติ" ทางเลือกจากจุดของธรรมชาติคือความเป็นไปได้ที่จะเกิดขึ้นในสถานการณ์นั้น และกำหนดความน่าจะเป็นที่แต่ละทางจะเกิดขึ้น{{r|Maschler et al|page1=50}}

โดยสรุปแล้ว การนิยามเกมรูปแบบขยาย ประกอบไปด้วย{{r|Fudenberg Tirole|page1=77}}
* เซตผู้เล่น
* ลำดับการตัดสินใจ
* ฟังก์ชันอรรถประโยชน์ซึ่งขึ้นกับการตัดสินใจทั้งหมดของผู้เล่นทุกฝ่าย
* ทางเลือกของผู้เล่นในแต่ละจุดที่ตัดสินใจ
* สิ่งที่ผู้เล่นทราบในแต่ละจุดที่ตัดสินใจ
* การแจกแจงความน่าจะเป็นสำหรับเหตุการณ์ภายนอกที่มีลักษณะสุ่ม

เกมในรูปแบบขยาย สามารถเขียนออกมาเป็นเกมรูปแบบกลยุทธ์ได้ โดยนิยามทางเลือกของผู้เล่นแต่ละฝ่ายให้ครอบคลุมทุกรูปแบบการตัดสินใจที่เป็นไปได้ การนิยามทางเลือกในรูปแบบนี้ เปรียบได้กับการที่ผู้เล่นตัดสินใจล่วงหน้าก่อนเริ่มเกมว่าจะตัดสินใจอย่างไรบ้างที่แต่ละจุดที่ต้องตัดสินใจ{{r|Fudenberg Tirole|page=85}} จากตัวอย่างแผนภาพต้นไม้เกมที่สารสนเทศสมบูรณ์ ผู้เล่น 2 มีจุดที่ต้องตัดสินใจสองจุด คือตัดสินใจหลังจากผู้เล่น 1 เลือก ''O'' และตัดสินใจว่าหลังจากผู้เล่น 1 เลือก ''F'' หากเขียนเป็นเกมแบบกลยุทธ์ ผู้เล่น 2 จะมีทางเลือกสี่ทาง คือ (''Oo'',''Fo''), (''Oo'',''Ff''), (''Of'',''Fo'') และ (''Of'', ''Ff'') ซึ่งเขียนออกมาเป็นเกมรูปแบบกลยุทธ์ได้ตามตารางนี้

{| style="background:white; text-align:center" align=center cellspacing=0 cellpadding=8 width=400
|+
!style="width:20%;|
!style="width:20%; border-bottom: solid black 1px;"| (''Oo'',''Fo'')
!style="width:20%; border-bottom: solid black 1px;"| (''Oo'',''Ff'')
!style="width:20%; border-bottom: solid black 1px;"| (''Of'',''Fo'')
!style="width:20%; border-bottom: solid black 1px;"| (''Of'',''Ff'')
|-
!style="border-right: solid black 1px; | ''O''
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 3,2
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 3,2
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 0,0
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 0,0
|-
!style="border-right: solid black 1px;| ''F''
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 0,0
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 0,0
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 2,3
|style="border-right: solid black 1px; border-bottom: solid black 1px;| 2,3
|}

=== เกมแบบร่วมมือ ===
การนิยามทฤษฎีเกมแบบร่วมมือ ไม่ได้นิยามในลักษณะทางเลือกในการตัดสินใจเลือกของผู้เล่นแต่ละฝ่าย แต่เป็นฟังก์ชันของกลุ่มผู้เล่น ({{lang|en|coalition}}) โดยค่าของฟังก์ชันนั้นคือค่าอรรถประโยชน์หากว่าผู้เล่นในกลุ่มนั้นตกลงร่วมมือกัน การนิยามเกมในลักษณะของทฤษฎีเกมแบบร่วมมือเรียกโดยทั่วไปว่าเป็นเกมรูปแบบการจัดกลุ่ม ({{lang|en|coalitional form}}) เกมลักษณะนี้แบ่งออกได้เป็นสองประเภทหลัก คือ เกมที่มีการยกอรรถประโยชน์ให้กันได้ ({{lang|en|transferable utility}}) และเกมที่ไม่มีการยกอรรถประโยชน์ให้กันได้ ({{lang|en|non-transferable utility}})

ในเกมที่มีการยกอรรถประโยชน์ให้กันได้ การจับกลุ่มผู้เล่นแต่ละกลุ่มจะมีค่าอรรถประโยชน์ร่วมกันหนึ่งค่า ซึ่งสมาชิกในกลุ่มนั้นๆ จะแบ่งกันอย่างไรก็ได้ กล่าวคือ อรรถประโยชน์มีลักษณะที่ยกให้กันในอัตราส่วนคงที่ เกมในลักษณะนี้สามารถเปรียบได้ว่าอรรถประโยชน์มีลักษณะเหมือนมูลค่าที่เป็นเงินตรา{{r|Hokari Thomson}} นิยามเกมที่มีการยกอรรถประโยชน์ให้กันได้ ประกอบไปด้วย เซตผู้เล่น <math>N</math> และฟังก์ชัน[[จำนวนจริง]]ที่ระบุค่า <math>v(S)</math> สำหรับทุกเซตย่อย <math>S \subseteq N</math> โดยแต่ละ[[เซตย่อย]] <math>S</math> ที่ไม่เป็น[[เซตว่าง]]นี้ เรียกว่าเป็นกลุ่มผู้เล่น (coalition) โดยทั่วไปจะกำหนดให้ค่าของเซตว่าง <math>v(\emptyset)</math> เท่ากับศูนย์

เกมที่ไม่มีการยกอรรถประโยชน์ให้กันได้ จะไม่สมมติว่าอรรถประโยชน์สามารถยกให้กันได้ในลักษณะหนึ่งต่อหนึ่ง โดยการนิยามเกมประเภทนี้จะระบุเซตของการแบ่งอรรถประโยชน์ที่เป็นไปได้ของแต่ละกลุ่มผู้เล่น <math>S \subseteq N</math> เป็น <math>V(S) \subset \mathbb{R}^S</math>{{r|Hokari Thomson}}

== แนวคิดผลเฉลย ==

แนวคิดผลเฉลย ({{lang|en|solution concept}}) หมายถึงฟังก์ชันหรือวิธีการที่ระบุผลลัพธ์จากเกมแต่ละเกม โดยนิยามของแนวคิดผลเฉลยแต่ละชนิดจะเป็นไปตามเงื่อนไขบางประการ{{r|Palgrave Game Theory}}

=== เกมแบบไม่ร่วมมือ ===
==== สมดุลแบบแนช ====
{{หลัก|สมดุลแบบแนช}}
แนวคิดสมดุลแบบแนช ({{lang|en|Nash equilibrium}}; เรียกตามชื่อของ[[จอห์น แนช]]) เป็นแนวคิดผลเฉลยสำคัญของทฤษฎีเกมแบบไม่ร่วมมือ หลักสำคัญของแนวคิดนี้คือ ผู้เล่นแต่ละฝ่ายเลือกทางเลือกที่ดีสุดสำหรับตนเอง เมื่อพิจารณาถึงทางเลือกของผู้เล่นอื่นในจุดสมดุลนั้นๆ{{r|Fudenberg Tirole|page=11}} ผู้เล่นแต่ละฝ่ายจึงไม่สามารถได้ประโยชน์มากขึ้นด้วยการเปลี่ยนทางเลือกของตัวเองแต่เพียงฝ่ายเดียวได้ในจุดสมดุล

จากนิยามของ[[#เกมรูปแบบกลยุทธ์|เกมรูปแบบกลยุทธ์]]ข้างต้น หากกำหนดให้ <math>s_{-i}</math> หมายถึงโพรไฟล์กลยุทธ์ของผู้เล่นทุกคนยกเว้นผู้เล่น <math>i</math> โพรไฟล์กลยุทธ์ <math>s</math> สามารถเขียนได้ในอีกรูปแบบหนึ่งเป็น <math>(s_i, s_{-i})</math>

โพร์ไฟล์กลยุทธ์ <math> s^* = (s_1^*, s_2^*, \dots, s_n^*) </math> ถือว่าเป็นจุดสมดุลแบบแนช ถ้ากลยุทธ์ <math>s_i^*</math> ที่ผู้เล่น <math>i</math> เลือก เป็นกลยุทธ์ที่ให้อรรถประโยชน์สูงสุดแก่ผู้เล่น <math>i</math> เมื่อผู้เล่นคนอื่นๆ เลือกเล่นกลยุทธ์ที่ระบุใน <math>s^*</math> กล่าวอีกทางหนึ่งคือ ผู้เล่นแต่ละคนในเกมไม่สามารถทำให้อรรถประโยชน์ของตัวเองสูงขึ้นด้วยการเลือกกลยุทธ์อื่นที่ไม่ใช่ <math>s_i^*</math> ตราบใดที่ผู้เล่นคนอื่นทุกคนเลือกกลยุทธ์ของตัวเองตามที่กำหนดในโพรไฟล์กลยุทธ์ <math>s^*</math> เงื่อนไขนี้เขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ได้ว่า{{r|Fudenberg Tirole|page=11|Maschler et al|page2=96}}
<math display="block">\forall i \in N, \forall s_i' \in S_i : u_i(s^*) \geq u_i(s_i', s^*_{-i})</math>

เกมบางเกมอาจไม่มีจุดสมดุลแบบแนชในกลยุทธ์แท้ ผลงานสำคัญของแนชคือการพิสูจน์ว่า เกมทุกเกมจะมีจุดสมดุลลักษณะนี้ในกลยุทธ์แบบผสมอย่างน้อยหนึ่งจุดเสมอ แนชพิสูจน์ทฤษฎีบทนี้โดยการใช้[[ทฤษฎีบทจุดตรึง]]{{r|Fudenberg Tirole|page1=29}} แนวทางการพิสูจน์ด้วยทฤษฎีบทจุดตรึงนี้สามารถพิสูจน์ทฤษฎีบทที่มีนัยทั่วไปกว่าทฤษฎีบทของแนชว่า หากว่าเกมมีเซตกลยุทธ์เป็นเซตย่อยของ[[ปริภูมิแบบยุคลิด]]ที่[[เซตกระชับ|กระชับ]] [[เซตคอนเวกซ์|คอนเวกซ์]] และไม่เป็น[[เซตว่าง]] และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละคนเป็น[[ฟังก์ชันต่อเนื่อง]]ในเซตโพรไฟล์กลยุทธ์ และ[[ฟังก์ชันกึ่งเว้า|กึ่งเว้า]]ต่อกลยุทธ์ของตัวเอง เกมนั้นก็จะมีจุดสมดุลแบบแนชอย่างน้อยหนึ่งจุด กล่าวได้ว่า ทฤษฎีบทของแนชเป็นกรณีเฉพาะของทฤษฎีบททั่วไปนี้{{r|Fudenberg Tirole|page1=34}}

==== สมดุลแบบสมบูรณ์ทุกเกมย่อย ====
[[ไฟล์:Game tree with incredible threat equilibrium.svg|thumb|เกมนี้มีจุดสมดุลแบบแนชคือ (''A'',''d'') และ (''B'',''c'') แต่ (''A'',''d'') ไม่ใช่จุดสมดุลที่สมบูรณ์ในเกมย่อย]]
สมดุลแบบแนชเป็นแนวคิดคำตอบที่นิยามจากเกมในรูปแบบกลยุทธ์ ซึ่งสามารถนำมาใช้กับเกมที่มีการตัดสินใจเป็นลำดับก่อนหลังได้เนื่องจากสามารถเขียนเกมออกไปในรูปแบบกลยุทธ์ได้โดยเปรียบเสมือนว่าผู้เล่นแต่ละฝ่ายเลือกกลยุทธ์ของตนเองทั้งเกมก่อนที่จะเริ่มเล่นเกมจริงๆ แต่สมดุลของแนชในเกมที่มีลำดับก่อนหลังอาจมีลักษณะที่มองได้ว่าเป็นการตัดสินใจที่ไม่สมเหตุสมผล เนื่องจากผู้เล่นสามารถเลือกกลยุทธ์ที่เรียกว่า "คำขู่ที่ไม่น่าเชื่อถือ" ({{lang|en|non-credible threat}}) ซึ่งมีลักษณะเหมือนกับการที่ผู้เล่นขู่ไว้ล่วงหน้าว่าจะเลือกทางที่ทำให้ตนเองเสียประโยชน์ เพื่อกดดันผู้เล่นฝ่ายอื่นที่ตัดสินใจก่อนหน้าให้เลือกทางเลือกอื่นแทน

[[สมดุลแบบสมบูรณ์ทุกเกมย่อย]] ({{lang|en|subgame perfect equilibrium}}) เป็นแนวคิดคำตอบที่กำหนดว่าการตัดสินใจของผู้เล่นจะต้องเป็นจุดสมดุลแบบแนชในทุกเกมย่อย ({{lang|en|subgame}}) ที่เริ่มจากจุดยอดใดๆ ในเกม จุดสมดุลแบบสมบูรณ์ทุกเกมย่อยสามารถหาได้ด้วยวิธีการนิรนัยย้อนกลับ ({{lang|en|backward induction}}) ซึ่งหมายถึงการพิจารณาตัดทางเลือกที่ไม่สมเหตุสมผลจากสิ้นสุดของเกมย้อนไปหาจุดเริ่มต้นของเกม

=== เกมแบบร่วมมือ ===
แนวทางการวิเคราะห์เกมแบบร่วมมือ มักประกอบด้วยการเลือกวิธีการจับกลุ่มของผู้เล่นหรือแบ่งผลประโยชน์ ที่เป็นไปตามเงื่อนไข ([[สัจพจน์]]) บางประการที่กำหนด เช่น ประสิทธิภาพ ความสมมาตร ความเท่าเทียม ความเสถียร เป็นต้น{{r|Hokari Thomson}} แนวคิดผลเฉลยของเกมแบบร่วมมือ อาจมีลักษณะเป็นเซต เช่น [[คอร์ (ทฤษฎีเกม)|คอร์]] [[เซตเสถียร]] หรือมีลักษณะเป็นจุดเดียว เช่น [[ค่าแชปลีย์]] [[นิวคลีโอลัส (ทฤษฎีเกม)|นิวคลีโอลัส]] เป็นต้น



== ประวัติ ==
== ประวัติ ==
บรรทัด 27: บรรทัด 158:


ในปี 2012 อัลวิน อี รอธ และ ลอยด์ เอส แชปลีย์ ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ "สำหรับทฤษฎีการจัดสรรอย่างคงที่และการใช้การออกแบบตลาด" และในปี 2014 รางวัลโนเบลได้มอบแก่นักทฤษฎีเกมที่ชื่อ ฌอง ธีโรล
ในปี 2012 อัลวิน อี รอธ และ ลอยด์ เอส แชปลีย์ ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ "สำหรับทฤษฎีการจัดสรรอย่างคงที่และการใช้การออกแบบตลาด" และในปี 2014 รางวัลโนเบลได้มอบแก่นักทฤษฎีเกมที่ชื่อ ฌอง ธีโรล

== รูปแบบของเกม ==
เกมที่ทฤษฎีเกมศึกษาประกอบด้วยผู้เล่นจำนวนหนึ่ง และทางเลือก (หรือกลยุทธ์) สำหรับผู้เล่นแต่ละคนที่จะสามารถเลือกได้ และรายละเอียดผลตอบแทนเมื่อนำกลยุทธ์ของผู้เล่นทั้งหมดมาคิดรวมกัน เกมความร่วมมือส่วนใหญ่อยู่ในรูปของแบบลักษณะเฉพาะ (characteristic function form) ขณะที่เกมรูปแบบครอบคลุมและรูปแบบปกติใช้นิยามเกมไม่ร่วมมือ

=== เกมรูปแบบขยาย ===
[[ไฟล์:Ultimatum Game Extensive Form.svg|thumb|left|แผนภาพต้นไม้แสดงทางเลือกในการตัดสินใจ]]
เกมในรูปแบบขยาย คือเกมที่แสดงถึงทางเลือก ของผู้เล่นแต่ละคน โดยใช้[[ต้นไม้ (ทฤษฎีกราฟ)|แผนภาพต้นไม้]] เพื่อแสดงถึงการตัดสินใจเลือกทางเลือกต่างๆ ตามลำดับ

โดยในการแทนเกมด้วยรูปแบบขยาย ปกติผู้เล่นจะทราบถึงการตัดสินใจของผู้เล่นอีกฝ่ายในตาก่อนหน้า โดยตั้งต้นที่จุดเริ่มแรก และจบที่จุดสิ้นสุดของเกม ซึ่งสามารถมีได้หลายจุด มีการใช้จุดยอดแทนสถานะที่มีทางเลือกในการตัดสินใจของผู้เล่น และใช้เส้นแทนทางเลือกของผู้เล่นในตาถัดไป

สำหรับเกมในภาพ มีผู้เล่นสองคน ''ผู้เล่น 1'' ตัดสินใจเลือกก่อนระหว่าง ''ทางเลือก F'' และ''ทางเลือก U'' จากนั้น''ผู้เล่น 2'' ซึ่งทราบถึงการตัดสินใจของ''ผู้เล่น 1'' ตัดสินใจเลือกระหว่าง ''ทางเลือก A'' และ''ทางเลือก R'' โดยมีผลตอบแทนที่ได้แสดงไว้ด้านล่าง เช่น ถ้า''ผู้เล่น 1'' เลือก ''U'' และ''ผู้เล่น 2'' เลือก ''A'' ผลตอบแทนที่ได้คือ ''ผู้เล่น 1'' ได้ 8 และ''ผู้เล่น 2'' ได้ 2

เกมหลายชนิด เช่น [[หมากรุก]] [[ทิก-แทก-โท]] สามารถแทนขั้นตอนในการเล่น ด้วยรูปแบบขยายได้

=== เกมรูปแบบปกติ ===
{{Payoff matrix
| Name = ตารางแสดงเกมที่มีผู้เล่น 2 คน และมี 2 ทางเลือก
| 2L = <font color=red>ผู้เล่น 2<br />เลือก ''ซ้าย''</font>
| 2R = <font color=red>ผู้เล่น 2<br />เลือก ''ขวา''</font>
| 1U = <font color=blue>ผู้เล่น 1<br />เลือก ''บน''</font>
| 1D = <font color=blue>ผู้เล่น 1<br />เลือก&nbsp;''ล่าง''</font>
| UL = <font color=blue>'''4'''</font>, <font color=red>'''3'''</font>
| UR = <font color=blue>'''–1'''</font>, <font color=red>'''–1'''</font>
| DL = <font color=blue>'''0'''</font>, <font color=red>'''0'''</font>
| DR = <font color=blue>'''3'''</font>, <font color=red>'''4'''</font>
| Float = right | Width = 330}}
เกมรูปแบบปกติ เป็นเกมที่ผู้เล่นไม่ทราบถึงการตัดสินใจของผู้เล่นคนอื่น นิยมเขียนแสดงเกมในรูปแบบตาราง ซึ่งมักจะใช้ในกรณีที่มีผู้เล่น 2 คน โดยผู้เล่นคนหนึ่งจะแทนการตัดสินใจด้วยแถวต่าง ๆ และผู้เล่นอีกคนหนึ่งแทนการตัดสินใจด้วยคอลัมน์ต่าง ๆ

สำหรับเกมในภาพ ''ผู้เล่น 1'' มีทางเลือก 2 ทาง คือ ''บน'' และ ''ล่าง'' ส่วน''ผู้เล่น 2'' มีทางเลือก 2 ทาง คือ ''ซ้าย'' และ ''ขวา'' จุดตัดของแถวและคอลัมน์จะแสดงถึงผลตอบแทนที่ผู้เล่นทั้งสองได้รับ เช่น ถ้า''ผู้เล่น 1'' เลือก ''บน'' และ''ผู้เล่น 2'' เลือก ''ซ้าย'' ผลตอบแทนที่ได้คือ ''ผู้เล่น 1'' ได้ 4 และ''ผู้เล่น 2'' ได้ 3

== ชนิดของเกม ==
=== เกมร่วมมือ และเกมไม่ร่วมมือ ===
เกมร่วมมือเป็นเกมที่ผู้เล่นแต่ละฝ่ายสามารถตกลงกันได้เพื่อให้ได้รับผลตอบแทนรวมที่ดีที่สุด โดยจะถือว่าผู้เล่นที่ร่วมมือกันจะเป็นผู้เล่นฝ่ายเดียวกันและจะปฏิบัติตามข้อตกลงที่ได้ตกลงกันไว้ ซึ่งแตกต่างจากเกมไม่ร่วมมือที่ผู้เล่นแต่ละฝ่ายไม่สามารถตกลงผลตอบแทนกันได้เลย จะต้องตัดสินใจโดยใช้ผลตอบแทนของตนเป็นหลักเท่านั้น

=== เกมสมมาตร และเกมไม่สมมาตร ===
{{Payoff matrix | Name = เกมไม่สมมาตร
| 2L = E | 2R = F
| 1U = E | UL = 1, 2 | UR = 0, 0
| 1D = F | DL = 0, 0 | DR = 1, 2 }}
เกมสมมาตรเป็นเกมที่ผลตอบแทนที่ได้รับขึ้นกับการตัดสินใจของตนเองและคนอื่นเท่านั้น โดยไม่ขึ้นกับว่าใครจะเป็นผู้เล่นเกมนี้ จึงมีกลยุทธในการเล่นที่เหมือนกันสำหรับผู้เล่นทุกคน เกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทางที่มีชื่อเสียงจำนวนมากจัดอยู่ในประเภทนี้ เช่น เกมความลำบากใจของนักโทษ เกมไก่ตื่น และเกมความร่วมใจ

เกมไม่สมมาตรจะมีกลยุทธในการเล่นที่แตกต่างกันออกไปสำหรับผู้เล่นแต่ละคน เช่นเกมในภาพถือว่าเป็นเกมไม่สมมาตร ถึงแม้กลยุทธในการเล่นที่ดีที่สุดจะเป็นกลยุทธเดียวกันก็ตาม

=== เกมผลรวมศูนย์ และเกมผลรวมไม่เป็นศูนย์ ===
{{Payoff matrix | Name = เกมผลรวมศูนย์
| 2L = A | 2R = B
| 1U = A | UL = –1, 1 | UR = 3, –3
| 1D = B | DL = 0, 0 | DR = –2, 2 }}
เกมผลรวมศูนย์เป็นกรณีเฉพาะของเกมผลรวมคงที่ ซึ่งเป็นเกมในลักษณะที่ผลรวมของผลตอบแทนที่ได้ของผู้เล่นจะเป็นค่าคงที่ เช่น การแบ่งปันผลกำไร หรือเกมที่มีผู้ชนะและผู้แพ้ เช่น [[หมากรุก]] [[หมากล้อม]] ก็ถือว่าเป็นเกมผลรวมศูนย์เช่นกัน ในการเขียนเกมในรูปแบบตารางที่มีผู้เล่นสองคนจึงสามารถละไว้โดยเขียนเพียงผลตอบแทนของผู้เล่นเพียงคนเดียวได้ และกลยุทธในการตัดสินใจให้ได้ผลตอบแทนมากที่สุดจะเป็นวิธีเดียวกับที่ทำให้ฝ่ายตรงข้ามได้ผลตอบแทนน้อยที่สุด

เกมส่วนมากที่นักทฤษฎีเกมศึกษามักจะเป็นเกมผลรวมไม่เป็นศูนย์ เนื่องจากในความเป็นจริง ผลลัพธ์ที่ได้ไม่จำเป็นต้องคงที่เสมอไป ขึ้นอยู่กับแนวทางการตัดสินใจของแต่ละฝ่าย ดังนั้น การได้รับผลตอบแทนมากที่สุดจึงไม่จำเป็นต้องทำให้ฝ่ายตรงข้ามได้ผลตอบแทนน้อยที่สุด


== ตัวอย่างเกมที่มีชื่อเสียง ==
== ตัวอย่างเกมที่มีชื่อเสียง ==
บรรทัด 175: บรรทัด 255:


== อ้างอิง ==
== อ้างอิง ==
{{รายการอ้างอิง}}
{{รายการอ้างอิง|refs=
<!-- ตำราทฤษฎีเกม -->

<ref name="Maschler et al">{{cite book |last1= Maschler |first1= Michael |last2= Solan |first2= Eilon |last3= Zamir |first3= Shmuel |translator-last= Hellman |translator-first= Ziv |title= Game theory |year= 2013 |publisher= Cambridge University Press |location= Cambridge |isbn=978-1-107-00548-8}}</ref>
== บรรณานุกรม ==
<ref name="Fudenberg Tirole">{{cite book |last1= Fudenberg |first1= Drew |last2= Tirole |first2= Jean |title= Game theory |year= 1991 |publisher= MIT Press |location= Cambridge, Massachusetts |isbn=978-0-262-06141-4}}</ref>
* กิตติกร นาคประสิทธิ์ (2550). "แนะนำทฤษฎีเกม", ''นิตยสารคณิตศาสตร์ MY MATHS'' ปีที่ 3 ฉบับที่ 2 เดือนมีนาคม 2550 หน้า 9 - 11
<ref name="Myerson">{{cite book |last= Myerson |first= Roger B. |title= Game theory: Analysis of conflict |year= 1991 |publisher= Harvard University Press |location= Cambridge, Massachusetts |isbn=0-674-34116-3}}</ref>
* นรินทร์ โอฬารกิจอนันต์ (2548). ''เอาตัวรอดด้วยทฤษฎีเกม'', โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย
<ref name="Osborne Rubinstein">{{cite book |last1= Osborne |first1= Martin J. |last2= Rubinstein |first2= Ariel |title= A course in game theory |year= 1994 |publisher= MIT Press |location= Cambridge, Massachusetts |isbn=0-262-65040-1}}</ref>
* Aumann, R.J. (1987). "game theory ," ''The New Palgrave: A Dictionary of Economics'', v. 2, pp. 460-82.
<ref name="Harsanyi Selten">{{cite book |last1= Harsanyi |first1= John C. |last2= Selten |first2= Reinhard |title= A general theory of equilibrium selection in games |year= 1988 |publisher= MIT Press |location= Cambridge, Massachusetts |isbn=0-262-08173-3}}</ref>
* Bierman, H. S. and L. Fernandez (1998). ''Game Theory with economic applications'', Addison-Wesley.
<ref name="VonNeumann Morgenstern">{{cite book |last1=Von Neumann |first1=John |authorlink1= |last2=Morgenstern |first2=Oskar |authorlink2= |title=Theory of Games and Economic Behavior |edition=3 |year=1953 |publisher=Princeton University Press |location=Princeton |language=en |oclc=10006173}}</ref>
* Camerer, Colin (2003). ''Behavioral Game Theory'' Princeton University Press ISBN 0-691-09039-4
<!-- บทหนังสือ -->
* Dutta, Prajit (2000). ''Strategies and Games: Theory and Practice'', MIT Press, ISBN 0-262-04169-3
<ref name="van Damme">{{Cite encyclopedia |edition= 2 |publisher= Elsevier |isbn= 978-0-08-097087-5 |volume= 9 |pages= 582–591 |editor-last= Wright |editor-first= James D. |last= van Damme |first= Eric |title= Game theory: Noncooperative games |encyclopedia= International encyclopedia of the social & behavioral sciences |doi= 10.1016/B978-0-08-097086-8.71048-8 |location= Oxford |date= 2015}}</ref>
* Fudenberg, Drew and Jean Tirole (1991). ''Game Theory'', MIT Press, , ISBN 0-262-06141-4
<ref name="Hokari Thomson">{{Cite encyclopedia |edition= 2 |publisher= Elsevier |isbn= 978-0-08-097087-5 |volume= 9 |pages= 867-880 |editor-last= Wright |editor-first= James D. |last1= Hokari |first= Toru |last2=Thomson |first2=William |title= Cooperative game theory |encyclopedia= International encyclopedia of the social & behavioral sciences |doi=10.1016/B978-0-08-097086-8.71073-7 |location= Oxford |date= 2015}}</ref>
* Gauthier, David (1987). ''Morals by Agreement'' Oxford University Press ISBN 0-19-824992-6
<ref name="Palgrave Game Theory">{{Cite encyclopedia |publisher= Palgrave Macmillan |isbn= 978-1-349-95121-5 |last= Aumann |first= R.J. |title= Game theory |encyclopedia= New Palgrave dictionary of economics |location= London |doi= 10.1057/978-1-349-95121-5_942-2 |date= 2008}}</ref>
* Gibbons, Robert (1992). ''Game Theory for Applied Economists'', Princeton University Press ISBN 0-691-00395-5
<ref name="Hart">{{cite book |last= Hart |first= Sergiu |editor-last1= Aumann |editor-first1=Robert J. |editor-last2= Hart |editor-first2=Sergiu |title=Handbook of game theory with economic applications |volume=1 |publisher=Elsevier |date=1992 |pages=19-40 |chapter=Games in extensive and strategic forms |doi=10.1016/S1574-0005(05)80005-0}}</ref>
* Gintis, Herbert (2000). ''Game Theory Evolving'', Princeton University Press ISBN 0-691-00943-0
<!-- บทความทฤษฎีเกม-->
* [http://www.forecastingprinciples.com/paperpdf/Greenforecastinginconflict.pdf Green, Kesten C. (2002).] Forecasting decisions in conflict situations: A comparison of game theory, role-playing, and unaided judgement. ''International Journal of Forecasting, 18'', 321–344.
<ref name="Nash 1951">{{Cite journal |issn= 0003-486X |volume= 54 |issue= 2 |pages= 286–295 |last= Nash |first= John |title= Non-cooperative games |journal= Annals of Mathematics |date= 1951 |jstor= 1969529}}</ref>
* [http://www.kestencgreen.com/gt_update_in_IJF21.pdf Green, Kesten C. (2005).] Game theory, simulated interaction, and unaided judgment for forecasting decisions in conflicts: Further evidence, ''International Journal of Forecasting, 21'', 463–472.
<!-- หนังสือหรือบทความที่ประยุกต์ทฤษฎีเกม -->
* Grim, Patrick, Trina Kokalis, Ali Alai-Tafti, Nicholas Kilb, and Paul St Denis (2004) "Making meaning happen." ''Journal of Experimental & Theoretical Artificial Intelligence'' 16 (4) : 209–243.
<ref name="Plant height">{{cite journal |last1= Falster |first1= Daniel S. |last2= Westoby |first2= Mark |title= Plant height and evolutionary games |journal= Trends in Ecology & Evolution |volume=18 |issue=7 |year=2003 |pages=337-343 |doi=10.1016/S0169-5347(03)00061-2 }}</ref>
* Harsanyi, John C. (1974.) An equilibrium point interpretation of stable sets, ''Management Science, 20'', 1472-1495.
<ref name="Biblical games">{{cite book| last1= Brams |first1= Steven J. |title=Biblical games: A strategic analysis of stories in the Old Testament |year= 1980 |publisher= MIT Press |isbn= 9780262021449}}</ref>
* Hendricks, Vincent F. & Hansen, Pelle G., eds. (2007) ''Game Theory: 5 Questions'', New York, London: Automatic Press / VIP. Read snippets from interviews [http://www.gametheorists.com]. ISBN 87-991013-4-3
}}
* Kaminski, Marek M. (2004) ''Games Prisoners Play'' Princeton University Press. ISBN 0-691-11721-7 http://webfiles.uci.edu/mkaminsk/www/book.html
* Kavka, Gregory (1986) ''Hobbesian Moral and Political Theory'' Princeton University Press. ISBN 0-691-02765-X
* Lewis, David (1969) ''Convention: A Philosophical Study''
* Mas-Colell, Whinston and Green (1995) : '' Microeconomic Theory''. Oxford University Press, ISBN 0-19-507340-1.
* Maynard Smith, J. and Harper, D. (2003) ''Animal Signals''. Oxford University Press. ISBN 0-19-852685-7
* Miller, James (2003). ''Game Theory At Work, McGraw-Hill ISBN 0-07-140020-6.''
* Myerson Roger B.. ''Game Theory: Analysis of Conflict'', Harvard University Press, Cambridge, 1991, ISBN 0-674-34116-3
* Osborne, Martin J. (2004). ''An Introduction to Game Theory'', Oxford University Press, New York. ISBN 0-19-512895-8
* Osborne, Martin J. and Ariel Rubinstein (1994). ''A Course in Game Theory'', MIT Press. ISBN 0-262-65040-1
* Poundstone, William (1992). ''Prisoner's Dilemma: John von Neumann, Game Theory and the Puzzle of the Bomb'', ISBN 0-385-41580-X
* Quine, W.v.O (1967) "Truth by Convention" in ''Philosophica Essays for A.N. Whitehead'' Russel and Russel Publishers. ISBN 0-8462-0970-5
* Quine, W.v.O (1960) "Carnap and Logical Truth" ''Synthese'' 12 (4) :350–374.
* Rasmusen, Eric (2006). ''Games and information'', 4th edition, Blackwell, Available online [http://www.rasmusen.org/GI/index.html]
* Skyrms, Brian (1996) ''Evolution of the Social Contract'' Cambridge University Press. ISBN 0-521-55583-3
* Skyrms, Brian (2004) ''The Stag Hunt and the Evolution of Social Structure'' Cambridge University Press. ISBN 0-521-53392-9.
* Sober, Elliot and David Sloan Wilson (1999) ''Unto Others: The Evolution and Psychology of Unselfish Behavior'' Harvard University Press. ISBN 0-674-93047-9


== แหล่งข้อมูลอื่น ==
== แหล่งข้อมูลอื่น ==

รุ่นแก้ไขเมื่อ 23:04, 12 กรกฎาคม 2562

ทฤษฎีเกม คือการศึกษาแบบจำลองทางคณิตศาสตร์ที่เกี่ยวกับการมีปฏิสัมพันธ์เชิงกลยุทธ์ระหว่างผู้ที่ตัดสินใจอย่างมีเหตุมีผล ทฤษฎีเกมมีการประยุกต์ใช้ในทางสังคมศาสตร์ทุกศาสตร์ รวมทั้งในทางตรรกศาสตร์และวิทยาการคอมพิวเตอร์ ในระดับดั้งเดิม ทฤษฎีเกมศึกษาเกมที่มีผลรวมเป็นศูนย์ ซึ่งหมายถึงเกมที่ผลได้ของคนหนึ่งจะนำไปสู่ผลเสียของอีกคนหนึ่ง ในปัจจุบัน ทฤษฎีเกมได้ประยุกต์ใช้ในศาสตร์หลายแขนงของความสัมพันธ์ในทางพฤติกรรม และกลายเป็นคำนิยามที่ครอบคลุมสำหรับศาสตร์ที่ศึกษาการตัดสินใจอย่างมีตรรกะในมนุษย์ สัตว์ และคอมพิวเตอร์

ทฤษฎีเกมสมัยใหม่เริ่มต้นเมื่อมีแนวคิดของการปรากฏซึ่งดุลยภาพของกลยุทธ์แบบผสมในเกมที่ผลได้รวมเป็นศูนย์ระหว่างสองคนซึ่งพิสูจน์โดยจอห์น ฟอน นอยมันน์ การพิสูจน์ดั้งเดิมของฟอน นอยมันน์ใช้ทฤษฎีบทจุดคงที่ของบราวเวอร์ที่สัมพันธ์กับเซตเว้าแบบต่อเนื่อง ซึ่งกลายเป็นวิธีมาตรฐานในทฤษฎีเกมและคณิตเศรษฐศาสตร์ งานของเขา และตามมาด้วยหนังสือในปี 1944 ที่ชื่อ Theory of Games and Economic Behavior ที่แต่งร่วมกับออสการ์ มอร์เกินสเติร์น ซึ่งศึกษาเกมร่วมมือกันของผู้เล่นหลายคน ในฉบับพิมพ์ครั้งที่สองของหนังสือเล่มนี้ได้นำเสนอสัจพจน์ว่าด้วยทฤษฎีออรถประโยชน์คาดหวัง ซึ่งทำให้นักคณิตสถิติศาสตร์และนักเศรษฐศาสตร์สามารถจัดการกับปัญหาการตัดสินใจในความไม่แน่นอนได้

ทฤษฎีเกมได้ถูกพัฒนาเป็นอย่างมากในทศวรรษที่ 1950 โดยนักวิชาการหลายท่าน และมันได้ถูกนำไปประยุกต์ใช้ในชีววิทยาในช่วงทศวรรษที่ 1970 แม้ว่าอาจจะเริ่มมีการพัฒนามาตั้งแต่ในช่วงทศวรรษที่ 1930 มาก่อนหน้านี้แล้ว ทฤษฎีเกมได้รับการยอมรับว่าเป็นเครื่องมือที่สำคัญในหลายๆ สาขา โดยในปี 2014 รางวัลโนเบลในสาขาเศรษฐศาสตร์ได้มอบรางวัลให้กับนักทฤษฎีเกมที่ชื่อ ฌอง ธีโรล และมีนักทฤษฎีเกมถึงสิบเอ็ดคนที่ได้รับรางวัลในสาขานี้ และจอห์น เมนาร์ด สมิธ ได้รางวัลคราฟูลด์จากการประยุกต์ใช้ทฤษฎีเกมในชีววิทยา

แนวคิดพื้นฐานของทฤษฎีเกม

ในทางทฤษฎีเกม "เกม" หมายถึงสถานการณ์ใดๆ ที่มีผู้ตัดสินใจตั้งแต่สองฝ่ายขึ้นไป โดยผู้ตัดสินใจแต่ละฝ่ายมีเป้าหมายของตนเองและผลลัพธ์ที่แต่ละฝ่ายได้รับขึ้นอยู่กับการตัดสินใจของทุกฝ่าย[1]: 1-2  ผู้ตัดสินใจแต่ละฝ่ายในเกมเรียกว่า "ผู้เล่น" โดยผู้เล่นนี้เป็นองค์ประกอบพื้นฐานของเกมในทฤษฎีเกมทุกประเภท[2]: 2  ทฤษฎีเกมตั้งข้อสมมติว่าผู้เล่นทุกฝ่ายตัดสินใจ "อย่างมีเหตุผล" ซึ่งหมายถึงการที่ผู้เล่นแต่ละฝ่ายมีเป้าหมายความต้องการของตัวเองที่ชัดเจนซึ่งมักแสดงในรูปของฟังก์ชันอรรถประโยชน์ และตัดสินใจโดยเลือกทางเลือกที่ทำให้ตัวเองได้รับอรรถประโยชน์สูงสุด[1]: 2 [2]: 4  ทฤษฎีเกมจึงมีความคล้ายกันกับทฤษฎีการตัดสินใจที่ศึกษาการตัดสินใจของผู้ตัดสินใจรายเดียว แต่แตกต่างกันที่ทฤษฎีเกมศึกษาการตัดสินใจในสถานการณ์ที่การตัดสินใจหลายฝ่ายส่งผลซึ่งกันและกัน[1]: 1  ในการประยุกต์ทฤษฎีเกมในสาขาต่างๆ ผู้เล่นในเกมอาจใช้หมายถึงปัจเจกบุคคล แต่ก็อาจใช้หมายถึงกลุ่มบุคคล เช่น บริษัท รัฐบาล ไปจนถึงสิ่งอื่นๆ ที่ไม่ใช่มนุษย์ เช่น สัตว์ พืช[3] พระเป็นเจ้า[4] เป็นต้น

การวิเคราะห์ทางทฤษฎีเกมมักกำหนดว่าผู้เล่นแต่ละฝ่ายมีฟังก์ชันอรรถประโยชน์แบบฟอน นอยมันน์–มอร์เกินสเติร์น ซึ่งมีลักษณะสำคัญคือ หากว่าผลลัพธ์ของการตัดสินใจมีความเป็นไปได้หลายทางและไม่แน่นอนว่าจะได้รับผลลัพธ์ใด ผู้เล่นนั้นจะตัดสินใจในลักษณะที่ให้ได้ค่าคาดหมายของฟังก์ชันอรรถประโยชน์นั้นสูงสุด[2]: 5 [5]: 9 

ทฤษฎีเกมแบบร่วมมือและแบบไม่ร่วมมือ

ทฤษฎีเกมสามารถแบ่งออกได้เป็นสองสาขาใหญ่ๆ ได้แก่ ทฤษฎีเกมแบบร่วมมือ (cooperative game theory) และทฤษฎีเกมแบบไม่ร่วมมือ (non-cooperative game theory) แต่ละสาขาของทฤษฎีเกมมีแนวทางการศึกษาที่แตกต่างกันในด้านรูปแบบการนิยามเกมและแนวคิดที่ใช้ในการวิเคราะห์ การจำแนกทฤษฎีสองแบบนี้มีที่มาเริ่มแรกจากบทความของจอห์น แนช ซึ่งตีพิมพ์ในปี 1951[6][7]: 1 

ในสาขาทฤษฎีเกมแบบไม่ร่วมมือ นิยามของเกมจะระบุทางเลือกทั้งหมดที่ผู้เล่นแต่ละฝ่ายสามารถตัดสินใจเลือกได้ ผู้เล่นแต่ละฝ่ายตัดสินใจโดยอิสระจากกันและไม่สามารถร่วมกันทำข้อตกลงอื่นๆ ให้มีผลบังคับใช้ได้ ในทฤษฎีเกมแบบร่วมมือ จะสมมติว่าผู้เล่นแต่ละฝ่ายสามารถทำข้อตกลงใดๆ กันก็ได้ โดยจะไม่ให้ความสำคัญกับขั้นตอนการเจราจาตกลงกันระหว่างผู้เล่น แต่ให้ความสำคัญกับการวิเคราะห์กลุ่มผู้เล่นว่าผู้เล่นจะมีการจับกลุ่มร่วมกันอย่างไรและจะมีการแบ่งผลประโยชน์กันอย่างไร[8] คำว่าเกมแบบไม่ร่วมมือในที่นี้ไม่ได้หมายความว่าทฤษฎีเกมชนิดนี้ไม่สามารถใช้จำลองสถานการณ์ที่มีการ "ร่วมมือ" กันในความหมายทั่วไปว่าการตกลงกระทำเพื่อให้ได้ประโยชน์ร่วมกัน แต่การจำลองสถานการณ์ความร่วมมือหรือการเจรจาต่อรองใดๆ จะต้องระบุทางเลือกและขั้นตอนเหล่านั้นในเกมอย่างชัดเจน และข้อตกลงเหล่านั้นจะไม่มีผลบังคับใช้นอกเหนือจากตามกระบวนการที่ระบุอย่างชัดเจนในเกม[7]: 4 [9]

รูปแบบการนิยามเกม

เกมแบบไม่ร่วมมือ

เกมรูปแบบกลยุทธ์

เกมรูปแบบกลยุทธ์ (strategic-form game) หรือเกมรูปแบบปรกติ (normal-form game) ประกอบไปด้วยการระบุผู้เล่นภายในเกม ทางเลือกของผู้เล่นแต่ละฝ่าย เรียกในทางทฤษฎีเกมว่ากลยุทธ์ และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละฝ่าย

ในกรณีที่เกมมีผู้เล่นสองฝ่าย และแต่ละฝ่ายมีทางเลือกจำนวนจำกัด เกมนั้นสามารถเขียนออกมาได้ในรูปของตารางโดยให้แต่ละแถวในตารางหมายถึงทางเลือกของผู้เล่นฝ่ายหนึ่ง และแต่ละสดมภ์หมายถึงทางเลือกของผู้เล่นอีกฝ่ายหนึ่ง ช่องของตารางแต่ละช่องระบุอรรถประโยชน์ของผู้เล่นสองฝ่ายในแต่ละกรณี[10]: 5  ดังตัวอย่างการนำเสนอเกมเป่ายิ้งฉุบในรูปแบบตารางนี้[5]: 78 

ค้อน กรรไกร กระดาษ
ค้อน 0,0 1,-1 -1,1
กรรไกร -1,1 0,0 1,-1
กระดาษ 1,-1 -1,1 0,0

โดยทั่วไปแล้ว จำนวนทางเลือกของผู้เล่นไม่จำเป็นต้องมีจำนวนจำกัด (ตัวอย่างกรณีที่ผู้เล่นมีทางเลือกไม่จำกัดคือ ผู้ขายสินค้าสามารถตั้งราคาขายสินค้าเป็นตัวเลขใดๆ ก็ได้) หากว่าทางเลือกของผู้เล่นทุกฝ่ายมีจำนวนจำกัด ทางเลือกในกรณีนี้จะเรียกว่าเป็นกลยุทธ์แท้ เกมกลยุทธ์แท้สามารถขยายให้ผู้เล่นสามารถเลือกกำหนดความน่าจะเป็นที่จะสุ่มเลือกทางเลือกแต่ละทาง เรียกว่ากลยุทธ์ผสม ตัวอย่างเข่น ในเกมเป่ายิ้งฉุบข้างต้น จอห์น ฟอน นอยมันน์ได้เขียนถึงการใช้กลยุทธ์ผสมว่า "สามัญสำนึกจะบอกได้ว่าวิธีที่ดีที่จะเล่นเกมนี้คือการเลือกทางเลือกทั้งสามทางด้วยความน่าจะเป็นแต่ละทางเท่ากับ 1/3"[11]: 144 

นิยามของเกมรูปแบบกลยุทธ์สามารถเขียนได้ว่า เกมรูปแบบกลยุทธ์ประกอบไปด้วย[5]: 77 

  • เซตผู้เล่น
  • เซตกลยุทธ์ ของผู้เล่น แต่ละฝ่าย โดยให้ เป็นสัญลักษณ์หมายถึงผลคูณคาร์ทีเซียน
  • ฟังก์ชันอรรถประโยชน์ ที่กำหนดความสัมพันธ์จาก ไปยังค่าอรรถประโยชน์ของผู้เล่น แต่ละฝ่าย ในที่นี้ เรียกว่าเป็นโพรไฟล์กลยุทธ์ (strategy profile)

ในกรณีที่ เป็นเซตกลยุทธ์แท้ เซตกลยุทธ์ผสม สามารถนิยามเป็นเซตของการแจกแจงความน่าจะเป็นของกลยุทธ์แท้ได้ว่า[5]: 146 

เกมรูปแบบขยาย

เกมรูปแบบขยาย (extensive-form game) เป็นรูปแบบการบรรยายลักษณะของเกมที่ระบุลำดับการตัดสินใจก่อนหลังของผู้เล่นแต่ละฝ่ายอย่างชัดเจน โดยประกอบไปด้วย (1) ผู้เล่น (2) ลำดับการตัดสินใจ (3) ฟังก์ชันอรรถประโยชน์ซึ่งขึ้นกับการตัดสินใจทั้งหมดของผู้เล่นทุกฝ่าย (4) ทางเลือกของผู้เล่นในแต่ละจุดที่ตัดสินใจ (5) สิ่งที่ผู้เล่นทราบในแต่ละจุดที่ตัดสินใจ (6) การแจกแจงความน่าจะเป็นสำหรับเหตุการณ์ภายนอกที่มีลักษณะสุ่ม[10]: 77 

เกมรูปแบบขยายสามารถเขียนได้รูปของกราฟแบบต้นไม้ที่จุดยอดแต่ละจุด (ยกเว้นจุดยอดปลายทาง) ระบุว่าผู้เล่นฝ่ายใดตัดสินใจ และจุดปลายทางระบุว่าผู้เล่นแต่ละฝ่ายได้รับอรรถประโยชน์เท่าใด[12] อาจกล่าวได้ว่าเกมรูปแบบขยาย มีลักษณะเหมือนต้นไม้ตัดสินใจที่มีผู้ตัดสินใจหลายฝ่าย[10]: 67 

เกมในรูปแบบขยายสามารถใช้บรรยายสถานการณ์ที่ผู้เล่นไม่ทราบอย่างครบถ้วนว่าการตัดสินใจต่างๆ ในจุดก่อนหน้าเป็นอย่างไร โดยการแบ่งจุดตัดสินใจทั้งหมดของผู้เล่นแต่ละฝ่ายออกเป็นเซตสารสนเทศ หากว่าเซตสารสนเทศมีสมาชิกมากกว่าหนึ่งจุด หมายความว่าหากเกมดำเนินไปถึงจุดใดจุดหนึ่งในเซตนั้น ผู้เล่นรายนั้นจะไม่ทราบแน่ชัดว่ากำลังตัดสินใจที่จุดใด ทุกจุดตัดสินใจในเซตสารสนเทศเดียวกันจะมีทางเลือกแบบเดียวกัน เกมที่ผู้เล่นรู้แน่ชัดว่ากำลังตัดสินใจที่จุดใด เรียกว่าเกมที่มีสารสนเทศสมบูรณ์ (perfect information) ซึ่งหมายความว่าเซตสารสนเทศทุกเซตจะมีสมาชิกเพียงจุดยอดเดียว[5]: 55 

เกมรูปแบบขยายยังสามารถใช้ระบุสถานการณ์ที่มีปัจจัยภายนอกที่มีลักษณะของความเสี่ยงหรือการสุ่มด้วย (เช่น การทอยลูกเต๋า) โดยใช้วิธีการกำหนดจุดยอดบางจุดว่าเป็นของผู้เล่นที่เรียกว่า "ธรรมชาติ" ทางเลือกจากจุดของธรรมชาติคือความเป็นไปได้ที่จะเกิดขึ้นในสถานการณ์นั้น และกำหนดความน่าจะเป็นที่แต่ละทางจะเกิดขึ้น[5]: 50 

โดยสรุปแล้ว การนิยามเกมรูปแบบขยาย ประกอบไปด้วย[10]: 77 

  • เซตผู้เล่น
  • ลำดับการตัดสินใจ
  • ฟังก์ชันอรรถประโยชน์ซึ่งขึ้นกับการตัดสินใจทั้งหมดของผู้เล่นทุกฝ่าย
  • ทางเลือกของผู้เล่นในแต่ละจุดที่ตัดสินใจ
  • สิ่งที่ผู้เล่นทราบในแต่ละจุดที่ตัดสินใจ
  • การแจกแจงความน่าจะเป็นสำหรับเหตุการณ์ภายนอกที่มีลักษณะสุ่ม

เกมในรูปแบบขยาย สามารถเขียนออกมาเป็นเกมรูปแบบกลยุทธ์ได้ โดยนิยามทางเลือกของผู้เล่นแต่ละฝ่ายให้ครอบคลุมทุกรูปแบบการตัดสินใจที่เป็นไปได้ การนิยามทางเลือกในรูปแบบนี้ เปรียบได้กับการที่ผู้เล่นตัดสินใจล่วงหน้าก่อนเริ่มเกมว่าจะตัดสินใจอย่างไรบ้างที่แต่ละจุดที่ต้องตัดสินใจ[10]: 85  จากตัวอย่างแผนภาพต้นไม้เกมที่สารสนเทศสมบูรณ์ ผู้เล่น 2 มีจุดที่ต้องตัดสินใจสองจุด คือตัดสินใจหลังจากผู้เล่น 1 เลือก O และตัดสินใจว่าหลังจากผู้เล่น 1 เลือก F หากเขียนเป็นเกมแบบกลยุทธ์ ผู้เล่น 2 จะมีทางเลือกสี่ทาง คือ (Oo,Fo), (Oo,Ff), (Of,Fo) และ (Of, Ff) ซึ่งเขียนออกมาเป็นเกมรูปแบบกลยุทธ์ได้ตามตารางนี้

(Oo,Fo) (Oo,Ff) (Of,Fo) (Of,Ff)
O 3,2 3,2 0,0 0,0
F 0,0 0,0 2,3 2,3

เกมแบบร่วมมือ

การนิยามทฤษฎีเกมแบบร่วมมือ ไม่ได้นิยามในลักษณะทางเลือกในการตัดสินใจเลือกของผู้เล่นแต่ละฝ่าย แต่เป็นฟังก์ชันของกลุ่มผู้เล่น (coalition) โดยค่าของฟังก์ชันนั้นคือค่าอรรถประโยชน์หากว่าผู้เล่นในกลุ่มนั้นตกลงร่วมมือกัน การนิยามเกมในลักษณะของทฤษฎีเกมแบบร่วมมือเรียกโดยทั่วไปว่าเป็นเกมรูปแบบการจัดกลุ่ม (coalitional form) เกมลักษณะนี้แบ่งออกได้เป็นสองประเภทหลัก คือ เกมที่มีการยกอรรถประโยชน์ให้กันได้ (transferable utility) และเกมที่ไม่มีการยกอรรถประโยชน์ให้กันได้ (non-transferable utility)

ในเกมที่มีการยกอรรถประโยชน์ให้กันได้ การจับกลุ่มผู้เล่นแต่ละกลุ่มจะมีค่าอรรถประโยชน์ร่วมกันหนึ่งค่า ซึ่งสมาชิกในกลุ่มนั้นๆ จะแบ่งกันอย่างไรก็ได้ กล่าวคือ อรรถประโยชน์มีลักษณะที่ยกให้กันในอัตราส่วนคงที่ เกมในลักษณะนี้สามารถเปรียบได้ว่าอรรถประโยชน์มีลักษณะเหมือนมูลค่าที่เป็นเงินตรา[13] นิยามเกมที่มีการยกอรรถประโยชน์ให้กันได้ ประกอบไปด้วย เซตผู้เล่น และฟังก์ชันจำนวนจริงที่ระบุค่า สำหรับทุกเซตย่อย โดยแต่ละเซตย่อย ที่ไม่เป็นเซตว่างนี้ เรียกว่าเป็นกลุ่มผู้เล่น (coalition) โดยทั่วไปจะกำหนดให้ค่าของเซตว่าง เท่ากับศูนย์

เกมที่ไม่มีการยกอรรถประโยชน์ให้กันได้ จะไม่สมมติว่าอรรถประโยชน์สามารถยกให้กันได้ในลักษณะหนึ่งต่อหนึ่ง โดยการนิยามเกมประเภทนี้จะระบุเซตของการแบ่งอรรถประโยชน์ที่เป็นไปได้ของแต่ละกลุ่มผู้เล่น เป็น [13]

แนวคิดผลเฉลย

แนวคิดผลเฉลย (solution concept) หมายถึงฟังก์ชันหรือวิธีการที่ระบุผลลัพธ์จากเกมแต่ละเกม โดยนิยามของแนวคิดผลเฉลยแต่ละชนิดจะเป็นไปตามเงื่อนไขบางประการ[8]

เกมแบบไม่ร่วมมือ

สมดุลแบบแนช

แนวคิดสมดุลแบบแนช (Nash equilibrium; เรียกตามชื่อของจอห์น แนช) เป็นแนวคิดผลเฉลยสำคัญของทฤษฎีเกมแบบไม่ร่วมมือ หลักสำคัญของแนวคิดนี้คือ ผู้เล่นแต่ละฝ่ายเลือกทางเลือกที่ดีสุดสำหรับตนเอง เมื่อพิจารณาถึงทางเลือกของผู้เล่นอื่นในจุดสมดุลนั้นๆ[10]: 11  ผู้เล่นแต่ละฝ่ายจึงไม่สามารถได้ประโยชน์มากขึ้นด้วยการเปลี่ยนทางเลือกของตัวเองแต่เพียงฝ่ายเดียวได้ในจุดสมดุล

จากนิยามของเกมรูปแบบกลยุทธ์ข้างต้น หากกำหนดให้ หมายถึงโพรไฟล์กลยุทธ์ของผู้เล่นทุกคนยกเว้นผู้เล่น โพรไฟล์กลยุทธ์ สามารถเขียนได้ในอีกรูปแบบหนึ่งเป็น

โพร์ไฟล์กลยุทธ์ ถือว่าเป็นจุดสมดุลแบบแนช ถ้ากลยุทธ์ ที่ผู้เล่น เลือก เป็นกลยุทธ์ที่ให้อรรถประโยชน์สูงสุดแก่ผู้เล่น เมื่อผู้เล่นคนอื่นๆ เลือกเล่นกลยุทธ์ที่ระบุใน กล่าวอีกทางหนึ่งคือ ผู้เล่นแต่ละคนในเกมไม่สามารถทำให้อรรถประโยชน์ของตัวเองสูงขึ้นด้วยการเลือกกลยุทธ์อื่นที่ไม่ใช่ ตราบใดที่ผู้เล่นคนอื่นทุกคนเลือกกลยุทธ์ของตัวเองตามที่กำหนดในโพรไฟล์กลยุทธ์ เงื่อนไขนี้เขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ได้ว่า[10]: 11 [5]: 96 

เกมบางเกมอาจไม่มีจุดสมดุลแบบแนชในกลยุทธ์แท้ ผลงานสำคัญของแนชคือการพิสูจน์ว่า เกมทุกเกมจะมีจุดสมดุลลักษณะนี้ในกลยุทธ์แบบผสมอย่างน้อยหนึ่งจุดเสมอ แนชพิสูจน์ทฤษฎีบทนี้โดยการใช้ทฤษฎีบทจุดตรึง[10]: 29  แนวทางการพิสูจน์ด้วยทฤษฎีบทจุดตรึงนี้สามารถพิสูจน์ทฤษฎีบทที่มีนัยทั่วไปกว่าทฤษฎีบทของแนชว่า หากว่าเกมมีเซตกลยุทธ์เป็นเซตย่อยของปริภูมิแบบยุคลิดที่กระชับ คอนเวกซ์ และไม่เป็นเซตว่าง และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละคนเป็นฟังก์ชันต่อเนื่องในเซตโพรไฟล์กลยุทธ์ และกึ่งเว้าต่อกลยุทธ์ของตัวเอง เกมนั้นก็จะมีจุดสมดุลแบบแนชอย่างน้อยหนึ่งจุด กล่าวได้ว่า ทฤษฎีบทของแนชเป็นกรณีเฉพาะของทฤษฎีบททั่วไปนี้[10]: 34 

สมดุลแบบสมบูรณ์ทุกเกมย่อย

เกมนี้มีจุดสมดุลแบบแนชคือ (A,d) และ (B,c) แต่ (A,d) ไม่ใช่จุดสมดุลที่สมบูรณ์ในเกมย่อย

สมดุลแบบแนชเป็นแนวคิดคำตอบที่นิยามจากเกมในรูปแบบกลยุทธ์ ซึ่งสามารถนำมาใช้กับเกมที่มีการตัดสินใจเป็นลำดับก่อนหลังได้เนื่องจากสามารถเขียนเกมออกไปในรูปแบบกลยุทธ์ได้โดยเปรียบเสมือนว่าผู้เล่นแต่ละฝ่ายเลือกกลยุทธ์ของตนเองทั้งเกมก่อนที่จะเริ่มเล่นเกมจริงๆ แต่สมดุลของแนชในเกมที่มีลำดับก่อนหลังอาจมีลักษณะที่มองได้ว่าเป็นการตัดสินใจที่ไม่สมเหตุสมผล เนื่องจากผู้เล่นสามารถเลือกกลยุทธ์ที่เรียกว่า "คำขู่ที่ไม่น่าเชื่อถือ" (non-credible threat) ซึ่งมีลักษณะเหมือนกับการที่ผู้เล่นขู่ไว้ล่วงหน้าว่าจะเลือกทางที่ทำให้ตนเองเสียประโยชน์ เพื่อกดดันผู้เล่นฝ่ายอื่นที่ตัดสินใจก่อนหน้าให้เลือกทางเลือกอื่นแทน

สมดุลแบบสมบูรณ์ทุกเกมย่อย (subgame perfect equilibrium) เป็นแนวคิดคำตอบที่กำหนดว่าการตัดสินใจของผู้เล่นจะต้องเป็นจุดสมดุลแบบแนชในทุกเกมย่อย (subgame) ที่เริ่มจากจุดยอดใดๆ ในเกม จุดสมดุลแบบสมบูรณ์ทุกเกมย่อยสามารถหาได้ด้วยวิธีการนิรนัยย้อนกลับ (backward induction) ซึ่งหมายถึงการพิจารณาตัดทางเลือกที่ไม่สมเหตุสมผลจากสิ้นสุดของเกมย้อนไปหาจุดเริ่มต้นของเกม

เกมแบบร่วมมือ

แนวทางการวิเคราะห์เกมแบบร่วมมือ มักประกอบด้วยการเลือกวิธีการจับกลุ่มของผู้เล่นหรือแบ่งผลประโยชน์ ที่เป็นไปตามเงื่อนไข (สัจพจน์) บางประการที่กำหนด เช่น ประสิทธิภาพ ความสมมาตร ความเท่าเทียม ความเสถียร เป็นต้น[13] แนวคิดผลเฉลยของเกมแบบร่วมมือ อาจมีลักษณะเป็นเซต เช่น คอร์ เซตเสถียร หรือมีลักษณะเป็นจุดเดียว เช่น ค่าแชปลีย์ นิวคลีโอลัส เป็นต้น


ประวัติ

จอห์น แนช

การอภิปรายในยุคแรกถึงตัวอย่างของเกมสองผู้เล่นเกิดขึ้นนานมาแล้วก่อนการศึกษาทฤษฎีเกมทางคณิตศาสตร์สมัยใหม่ โดยพบหลักฐานที่กล่าวถึงทฤษฎีเกมเป็นครั้งแรกในจดหมายเมื่อปี พ.ศ. 2256 ซึ่งเขียนโดย เจมส์ เวลด์เกรฟ เขาได้ทำการวิเคราะห์หากลยุทธที่ดีที่สุดในการเล่นเกมไพ่ชนิดหนึ่งที่มีผู้เล่นสองคน ชื่อว่า le Her โดยใช้หลักการคล้ายกับทฤษฎีเกม ต่อมา เจมส์ แมดิสันได้วิเคราะห์ทฤษฎีเกมถึงวิธีที่รัฐจะถูกคาดหวังให้วางตัวภายใต้ระบบการเก็บภาษีที่แตกต่างกัน[14][15] และอ็องตวน-โอกุสแต็ง กูร์โน ได้ตีพิมพ์ผลงานเรื่อง Researches into the Mathematical Principles of the Theory of Wealth ใน พ.ศ. 2381 ซึ่งเป็นกรณีทั่วไปของการศึกษาของเจมส์

ทฤษฎีเกมได้มีการศึกษาเป็นสาขาเฉพาะครั้งแรกเมื่อจอห์น ฟอน นอยมันน์ตีพิมพ์ผลงานของตนในปี พ.ศ. 2473[16] และได้ตีพิมพ์ตำรา Theory of Games and Economic Behavior ที่เขียนร่วมกับ ออสการ์ มอร์เกินสเติร์น ใน พ.ศ. 2487 ซึ่งกล่าวถึงวิธีการหาทางเลือกที่สอดคล้องกันทั้งสองฝ่ายสำหรับเกมที่ต้องมีแพ้-ชนะสองผู้เล่น ในช่วงนี้ งานศึกษาทฤษฎีเกมส่วนใหญ่มุ่งศึกษาทฤษฎีเกมความร่วมมือ ซึ่งวิเคราะห์ถึงกลยุทธ์ที่เหมาะสมที่สุดสำหรับกลุ่มบุคคล โดยสันนิษฐานว่าพวกเขาสามารถตกลงในข้อตกลงระหว่างกันเกี่ยวกับกลยุทธ์ที่เหมาะสมได้[17]

ใน พ.ศ. 2493 ได้ปรากฏการอภิปรายครั้งแรกถึงปัญหา "ความลำบากใจของนักโทษ" ขึ้น ซึ่งในขณะเดียวกัน จอห์น แนชได้พัฒนาหลักเกณฑ์สำหรับความสอดคล้องกันในกลยุทธ์ของผู้เล่นทั้งสองฝ่าย ซึ่งเรียกว่า "จุดสมดุลของแนช" ซึ่งใช้ได้กับเกมหลากหลายประเภทกว่าเกณฑ์ที่เสนอโดยฟอน นอย์มันน์และมอร์เกินสเติร์น จุดสมดุลดังกล่าวเป็นเรื่องทั่วไปมากพอที่จะเปิดโอกาสให้วิเคราะห์เกมการแข่งขันนอกเหนือไปจากเกมความร่วมมือได้ จอห์น แนชได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ ร่วมกับจอห์น ฮาร์ชาญี และไรน์ฮาร์ด เซลเทน ในปี พ.ศ. 2537 ในฐานะที่เป็นผู้นำหลักทฤษฎีเกมไปประยุกต์ใช้ในด้านเศรษฐศาสตร์ และในช่วงคริสต์ศวรรษ 1970 (พ.ศ. 2513-2522) ได้มีการประยุกต์ทฤษฎีเกมเข้ากับวิชาชีววิทยา ส่วนการประยุกต์ในวิชารัฐศาสตร์และปรัชญาได้มีมาตั้งแต่คริสต์ทศวรรษ 1950 (พ.ศ. 2493-2502) แล้ว

ทฤษฎีเกมประสบกับกิจกรรมจำนวนมากในทศวรรษที่ 1950 ในช่วงที่แนวคิดเรื่องแก่นหลัก เกมรูปแบบขยาย การเล่นไม่จริง เกมซ้ำๆ และมูลค่าแชปลีย์ ถูกพัฒนาขึ้น นอกจากนี้

ใน 1979 โรเบิร์ต อเซลรอด พยายามที่จะสร้างโปรแกรมคอมพิวเตอร์เปรียบเสมือนกับผู้เล่นและพบว่าในการแข่งขันระหว่างกัน ผู้ชนะมักจะเป็นโปรแกรม "ตาต่อตา ฟันต่อฟัน" ที่ร่วมมือกันในขั้นตอนแรก และในระยะถัดมาจะทำในสิ่งที่คู่ต่อสู้ทำในระยะก่อนหน้าทุกครั้ง

ความสำเร็จในด้านการชนะรางวัลต่างๆ

ในปี 1965 ไรน์ฮาร์ด เซลเทนได้ริเริ่มแนวคิดของผลลัพธ์ที่เรียกว่าดุลยภาพสมบูรณ์ของเกมย่อย ซึ่งต่อมาได้เป็นการปัดฝุ่นคำว่าดุลยภาพของแนชขึ้นมาใหม่ (ต่อมาเขาได้ริเริ่มดุลยภาพสมบูรณ์ของภาวะสั่นไหวของมือขึ้นมาอีกเช่นกัน) ในปี 1994 แนช เซลเทน และฮาร์ซานยี ได้เป็นผู้ชนะรางวัลโนเบลสาขาเศรษฐศาสตร์สำหรับงานที่เกี่ยวกับทฤษฎีเกมทางเศรษฐศาสตร์

ในทศวรรษ 1970 ได้มีการประยุกต์ทฤษฎีเกมเข้ากับวิชาชีววิทยา โดยส่วนใหญ่เป็นผลงานของจอห์น เมนาร์ด สมิธ และกลยุทธ์วิวัฒนาการอย่างคงที่ นอกจากนี้ แนวคิดของดุลยภาพสหสัมพันธ์ ภาวะสมบูรณ์ของภาวะการสั่นไหวของมือ และความรู้ร่วม ถูกนำมาใช้และวิเคราะห์

ในปี 2005 นักทฤษฎีเกม โทมัส เชลลิง และโรเบิร์ต ออมันน์ ได้รับรางวัลโนเบลต่อจากแนช เซลเทน และฮาร์ซานยี โดยเชลลิงศึกษาทางด้านแบบจำลองพลวัต ซึ่งเป็นตัวอย่างแรกๆ ของทฤษฎีเกมเชิงวิวัฒนาการ ออมันน์เน้นศึกษาเกี่ยวกับดุลยภาพ ได้ริเริ่มดุลยภาพแบบหยาบ ดุลยภาพสหสัมพันธ์ และพัฒนาการวิเคราะห์ที่เป็นระเบียบมากขึ้นสำหรับสมมติฐานที่เกี่ยวกับความรู้ร่วมและผลที่ตามมา

ในปี 2007 เลโอนิด ฮัวร์วิกซ์ ร่วมกับอีริก มัสกิน และโรเจอร์ ไมเออร์สัน ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จาก "การวางรากฐานทฤษฎีการออกแบบกลไก" งานของไมเออร์สันรวมถึงการนำเสนอดุลยภาพที่เหมาะสม และหนังสือระดับปริญญาโทที่สำคัญ Game Theory, Analysis of Conflict ส่วนฮัวร์วิกซ์ริเริ่มและทำแนวคิดของแรงจูงใจที่สอดคล้องกันให้เป็นรูปเป็นร่างมากขึ้น

ในปี 2012 อัลวิน อี รอธ และ ลอยด์ เอส แชปลีย์ ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ "สำหรับทฤษฎีการจัดสรรอย่างคงที่และการใช้การออกแบบตลาด" และในปี 2014 รางวัลโนเบลได้มอบแก่นักทฤษฎีเกมที่ชื่อ ฌอง ธีโรล

ตัวอย่างเกมที่มีชื่อเสียง

เกมความลำบากใจของนักโทษ

เกมความลำบากใจของนักโทษ (Prisoner's dilemma) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง แนวคิดของเกมนี้ได้สร้างขึ้นโดย เมอร์ริล ฟลูด และ เมลวิน เดรชเชอร์ ใน พ.ศ. 2493 โดยมีลักษณะเป็นเกมที่ผู้เล่นทั้งสองฝ่ายพยายามเลือกทางเลือกที่ได้ผลตอบแทนมากที่สุด แต่กลับทำให้ผลตอบแทนรวมที่ได้ต่ำลง มีสถานการณ์ดังนี้

คนร้ายสองคนคือ A และ B ถูกตำรวจจับและถูกแยกไปสอบปากคำทีละคน ตำรวจไม่สามารถดำเนินคดีกับคนร้ายทั้งสองได้ทันทีเพราะไม่มีพยาน คนร้ายแต่ละคนมีทางเลือกสองทางคือ รับสารภาพ และไม่รับสารภาพ ถ้าคนร้ายคนหนึ่งรับสารภาพแต่อีกคนไม่รับ ตำรวจจะกันคนที่รับสารภาพไว้เป็นพยานและปล่อยตัวไป และจะส่งฟ้องคนที่ไม่รับสารภาพซึ่งมีโทษจำคุก 20 ปี ถ้าทั้งสองคนรับสารภาพ จะได้รับการลดโทษเหลือจำคุกคนละ 10 ปี แต่ถ้าทั้งสองคนไม่รับสารภาพ ตำรวจจะสามารถส่งฟ้องได้เพียงข้อหาเล็กน้อยเท่านั้นซึ่งมีโทษจำคุก 1 ปี

เกมนี้สามารถเขียนแสดงในรูปแบบตารางได้ดังนี้

รับสารภาพ ไม่รับสารภาพ
รับสารภาพ -10, -10 0, -20
ไม่รับสารภาพ -20, 0 -1, -1

จะเห็นว่ากลยุทธเด่นของผู้เล่นทั้งสองฝ่ายคือการรับสารภาพ เพราะไม่ว่าผู้เล่นอีกฝ่ายจะตัดสินใจอย่างไร ก็จะได้ผลตอบแทนที่ดีกว่าเสมอ แต่เมื่อทั้งสองฝ่ายเลือกทางเลือกนี้ กลับไม่ให้ผลตอบแทนที่ดีที่สุด ถึงแม้ผู้เล่นจะทราบว่าผลตอบแทนที่ดีที่สุดจะเกิดขึ้นเมื่อทั้งสองฝ่ายไม่รับสารภาพ แต่ทั้งคู่อาจไม่กล้าทำเพราะไม่ไว้ใจอีกฝ่ายว่าจะรับสารภาพหรือไม่ จึงทำให้ทั้งสองฝ่ายต้องได้รับผลตอบแทนที่ต่ำลง และจุด (-10, -10) ก็เป็นจุดสมดุลของแนชในเกมนี้ เพราะผู้เล่นทั้งสองฝ่ายไม่สามารถเปลี่ยนไปเลือกทางเลือกอื่นที่ได้ผลตอบแทนดีกว่านี้

เกมไก่ตื่น

เกมไก่ตื่น (Chicken) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง มีสถานการณ์ดังนี้

ผู้เล่นสองคนขับรถด้วยความเร็วสูงเข้าหากัน ฝ่ายที่หักหลบรถก่อนจะเป็นผู้แพ้ แต่ถ้าผู้เล่นทั้งสองฝ่ายไม่หักหลบรถ รถจะชนกันและจะทำให้ผู้เล่นทั้งสองฝ่ายเกิดความเสียหายอย่างมาก

เกมนี้สามารถเขียนแสดงในรูปแบบตารางได้ดังนี้

หลบ ไม่หลบ
หลบ 0, 0 -1, +1
ไม่หลบ +1, -1 -10, -10

จะเห็นว่าเกมในรูปแบบนี้ไม่มีกลยุทธเด่น และมีจุดสมดุลของแนชสองจุดคือ (-1, +1) และ (+1, -1) แต่วิธีทางจิตวิทยาสำหรับผู้เล่นเกมนี้คือ พยายามส่งสัญญาณให้ผู้เล่นฝ่ายตรงข้ามเห็นว่า ตนจะไม่หักหลบอย่างแน่นอน ซึ่งจะทำให้ผู้เล่นฝ่ายตรงข้ามต้องยอมหักหลบไปเอง มิฉะนั้นจะเสียผลตอบแทนอย่างมาก

เกมแห่งความร่วมมือ

เกมแห่งความร่วมมือ (Stag hunt) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง ซึ่งเป็นทางเลือกระหว่างทางที่ปลอดภัยกับการให้ความร่วมมือกับอีกฝ่าย มีสถานการณ์ดังนี้

ผู้เล่นสองคนต้องการเลือกล่าสัตว์ชนิดหนึ่งระหว่างกวางกับกระต่าย ซึ่งกวางมีราคาดีกว่ากระต่ายมาก แต่ก็ล่ายากกว่าเช่นกัน จำเป็นต้องใช้สองคนร่วมมือกันจึงจะล่าได้ ในขณะที่กระต่ายมีราคาต่ำแต่ล่าได้ง่าย สามารถล่าได้โดยใช้เพียงคนเดียว

เกมนี้สามารถเขียนแสดงในรูปแบบตารางได้ดังนี้

ล่ากวาง ล่ากระต่าย
ล่ากวาง +10, +10 0, +3
ล่ากระต่าย +3, 0 +3, +3

จะเห็นว่าเกมในรูปแบบนี้ไม่มีกลยุทธเด่น และมีจุดสมดุลของแนชสองจุดคือ (+10, +10) และ (+3, +3) ซึ่งการที่ผู้เล่นทั้งสองจะได้ผลตอบแทนสูงสุดนั้น จะต้องอาศัยความร่วมมือร่วมใจกัน คือเลือกล่ากวางทั้งคู่ ซึ่งผู้เล่นจะต้องมีความไว้วางใจผู้เล่นอีกฝ่ายด้วย

การประยุกต์ใช้

รัฐศาสตร์

มีการนำทฤษฎีเกมมาประยุกต์ใช้ในด้านรัฐศาสตร์ เช่น การหาเสียงเลือกตั้ง ในปี พ.ศ. 2500 แอนโทนี ดาวน์ส ได้ตีพิมพ์ผลงานเรื่อง An Economic Theory of Democracy ซึ่งมีเนื้อหาเกี่ยวกับการเลือกตำแหน่งในการหาเสียงเลือกตั้งให้ได้ผลดีที่สุด

เศรษฐศาสตร์

ในทางเศรษฐศาสตร์ ได้มีการนำทฤษฎีเกมมาช่วยในการตัดสินใจในหลาย ๆ ด้านมาเป็นเวลานานแล้ว เช่น การต่อรองผลประโยชน์ การประมูล การแข่งขันของผู้ผลิต การรวมกลุ่มทางเศรษฐกิจ โดยมีแนวคิดสำคัญที่ใช้คือเรื่องจุดสมดุลของแนช อย่างไรก็ตาม ในเกมการแข่งขันทางธุรกิจ อาจมีการปรับเปลี่ยนกลยุทธได้ตลอดเวลาเพื่อให้ได้รับผลตอบแทนที่สูงขึ้น และผลลัพธ์ที่ได้ก็จะเข้าสู่จุดสมดุลของแนช ซึ่งเป็นจุดที่ทุกฝ่ายไม่สามรถเปลี่ยนกลยุทธเพื่อให้ได้ผลตอบแทนสูงกว่านี้อีกแล้ว

ชีววิทยา

มีการใช้ทฤษฎีเกมเพื่ออธิบายถึงปรากฏการณ์ต่าง ๆ ทางชีววิทยา เช่น ในปี พ.ศ. 2473 โรนัลด์ ฟิชเชอร์ ได้ใช้ทฤษฎีเกมในการอธิบายถึงอัตราส่วนของสัตว์เพศผู้ต่อเพศเมียที่เป็น 1:1 เนื่องจากเป็นอัตราส่วนที่สามารถสืบพันธุ์ได้จำนวนมากที่สุด นอกจากนี้ นักชีววิทยายังใช้ทฤษฎีเกมเพื่อช่วยในการศึกษาพฤติกรรมต่าง ๆ ของสัตว์ เช่น การใช้เกมไก่ตื่นในการอธิบายถึงการต่อสู้ของสัตว์

วิทยาการคอมพิวเตอร์

มีการพัฒนาในด้านวิทยาการคอมพิวเตอร์และการเขียนโปรแกรมเพื่อหาขั้นตอนวิธีที่ดีที่สุดในการเล่นเกมในสถานการณ์หนึ่งเป็นระยะเวลานาน

สังคมวิทยา

ได้มีการนำทฤษฎีเกมมาประยุกต์ใช้ในด้านสังคมวิทยา เช่น วิลลาร์ด แวน ออร์มาน ควินท์ และ เดวิด ลูอิส ได้พัฒนาการศึกษาด้านประเพณีนิยม และมีการวิเคราะห์เกี่ยวกับเกมต่าง ๆ ที่ต้องเลือกระหว่างศีลธรรมกับผลประโยชน์ของตนเอง เช่น เกมความลำบากใจของนักโทษ

ในวัฒนธรรมร่วมสมัย

  • ชีวิตของนักทฤษฎีเกมและนักคณิตศาสตร์ จอห์น แนช ได้ถูกนำมาสร้างเป็นหนังอิงชีวประวัติในปี 2001 ในชื่อ A Beautiful Mind โดยอิงจากหนังสือปี 1998 โดยซิลเวียร์ นาซาร์ นำแสดงโดยรัสเซลล์ โครว์ที่เล่นเป็นแนช
  • ในปี 1959 นวนิยายวิทยาศาสตร์สงคราม Starship Troopers โดย โรเบิร์ต เอ ไฮน์ไลน์ ได้อ้างถึง "ทฤษฎีเกม" และ "ทฤษฎีแห่งเกม" ในภาพยนตร์เรื่องเดียวกันในปี 1997 ตัวละครที่ชื่อ คาร์ล เจนกินส์ ได้อ้างถึงงานด้านการข่าวกรองทางการทหารนี้ว่าเป็นการมอบหมายงานด้าน "เกมและทฤษฎี"

อ้างอิง

  1. 1.0 1.1 1.2 Myerson, Roger B. (1991). Game theory: Analysis of conflict. Cambridge, Massachusetts: Harvard University Press. ISBN 0-674-34116-3.
  2. 2.0 2.1 2.2 Osborne, Martin J.; Rubinstein, Ariel (1994). A course in game theory. Cambridge, Massachusetts: MIT Press. ISBN 0-262-65040-1.
  3. Falster, Daniel S.; Westoby, Mark (2003). "Plant height and evolutionary games". Trends in Ecology & Evolution. 18 (7): 337–343. doi:10.1016/S0169-5347(03)00061-2.
  4. Brams, Steven J. (1980). Biblical games: A strategic analysis of stories in the Old Testament. MIT Press. ISBN 9780262021449.
  5. 5.0 5.1 5.2 5.3 5.4 5.5 5.6 Maschler, Michael; Solan, Eilon; Zamir, Shmuel (2013). Game theory. แปลโดย Hellman, Ziv. Cambridge: Cambridge University Press. ISBN 978-1-107-00548-8.
  6. Nash, John (1951). "Non-cooperative games". Annals of Mathematics. 54 (2): 286–295. ISSN 0003-486X. JSTOR 1969529.
  7. 7.0 7.1 Harsanyi, John C.; Selten, Reinhard (1988). A general theory of equilibrium selection in games. Cambridge, Massachusetts: MIT Press. ISBN 0-262-08173-3.
  8. 8.0 8.1 Aumann, R.J. (2008). "Game theory". New Palgrave dictionary of economics. London: Palgrave Macmillan. doi:10.1057/978-1-349-95121-5_942-2. ISBN 978-1-349-95121-5.
  9. van Damme, Eric (2015). "Game theory: Noncooperative games". ใน Wright, James D. (บ.ก.). International encyclopedia of the social & behavioral sciences. Vol. 9 (2 ed.). Oxford: Elsevier. pp. 582–591. doi:10.1016/B978-0-08-097086-8.71048-8. ISBN 978-0-08-097087-5.
  10. 10.0 10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 Fudenberg, Drew; Tirole, Jean (1991). Game theory. Cambridge, Massachusetts: MIT Press. ISBN 978-0-262-06141-4.
  11. Von Neumann, John; Morgenstern, Oskar (1953). Theory of Games and Economic Behavior (ภาษาอังกฤษ) (3 ed.). Princeton: Princeton University Press. OCLC 10006173.
  12. Hart, Sergiu (1992). "Games in extensive and strategic forms". ใน Aumann, Robert J.; Hart, Sergiu (บ.ก.). Handbook of game theory with economic applications. Vol. 1. Elsevier. pp. 19–40. doi:10.1016/S1574-0005(05)80005-0.
  13. 13.0 13.1 13.2 Hokari, Toru; Thomson, William (2015). "Cooperative game theory". ใน Wright, James D. (บ.ก.). International encyclopedia of the social & behavioral sciences. Vol. 9 (2 ed.). Oxford: Elsevier. pp. 867–880. doi:10.1016/B978-0-08-097086-8.71073-7. ISBN 978-0-08-097087-5.
  14. James Madison, Vices of the Political System of the United States, April, 1787. Link
  15. Jack Rakove, "James Madison and the Constitution", History Now, Issue 13 September 2007. Link
  16. J. v. Neumann (1928). "Zur Theorie der Gesellschaftsspiele," Mathematische Annalen, 100(1), p p. 295-320. English translation: "On the Theory of Games of Strategy," in A. W. Tucker and R. D. Luce, ed. (1959),Contributions to the Theory of Games, v. 4, p p. 13-42.
  17. Leonard, Robert. Von Neumann, Morgenstern, and the Creation of Game Theory. Cambridge University Press, 2010

แหล่งข้อมูลอื่น

วิกิตำราภาษาอังกฤษ มีคู่มือ ตำรา หรือวิธีการเกี่ยวกับ: ทฤษฎีเกม