สัจพจน์ของความน่าจะเป็น

จากวิกิพีเดีย สารานุกรมเสรี

สัจพจน์ของความน่าจะเป็น (อังกฤษ: the axioms of probability) ถูกเสนอเป็นครั้งแรกในปี ค.ศ. 1936 โดยคอลโมโกรอฟ นักคณิตศาสตร์ชาวรัสเซีย1 ในทฤษฎีความน่าจะเป็นทางคณิตศาสตร์ ความน่าจะเป็นถูกนิยามด้วยฟังก์ชัน แต่ไม่ได้หมายความว่าทุกๆ ฟังก์ชันจะสามารถแปลความหมายเป็นฟังก์ชันของความน่าจะเป็นได้ทั้งหมด สัจพจน์ของความน่าจะเป็นจึงถูกนิยามมาเพื่อกำหนดว่าฟังก์ชันใดสามารถที่จะแปลความหมายในเชิงความน่าจะเป็นได้ กล่าวโดยสรุป ฟังก์ชันความน่าจะเป็น ก็คือ ฟังก์ชันทางคณิตศาสตร์ที่มีคุณสมบัติตรงกับที่สัจพจน์คอลโมโกรอฟกำหนดไว้ทุกข้อ ในทฤษฎีความน่าจะเป็นแบบเบย์ สัจพจน์ของความน่าจะเป็นถูกเสนอ โดยบรูโน เด ฟิเนตติ นักคณิตศาสตร์ชาวอิตาเลียนและริชาร์ด คอกซ์ นักฟิสิกส์ชาวอเมริกัน เด ฟิเนตติเสนอสัจพจน์โดยมีแนวคิดมาจากเกมส์การพนัน ส่วนคอกซ์เสนอสัจพจน์ของเขาโดยมีแนวคิดมาจากการขยายความสามารถของตรรกศาสตร์แบบอริสโตเติล สิ่งที่น่าทึ่งก็คือ ในทางปฏิบัติโดยทั่วไปแล้ว2 สัจพจน์ของคอลโมโกรอฟ, เด ฟิเนตติ และคอกซ์ จะให้ผลลัพธ์ที่เหมือนกัน (ทั้งๆ ที่ทั้งสามท่านมีแนวคิดเริ่มต้นต่างกันโดยสิ้นเชิง)

สัจพจน์ของความน่าจะเป็นอย่างง่าย[แก้]

กำหนดให้ P (x) เป็นฟังก์ชันใดๆ ทางคณิตศาสตร์ โดยมีโดเมนคือ \Omega เราจะกล่าวว่า P (x) เป็นฟังก์ชันของความน่าจะเป็นก็ต่อเมื่อ P (x) มีคุณสมบัติต่อไปนี้

  1.  P (A) \geq 0 สำหรับ A ที่เป็นสับเซตของ \Omega
  2.  P (\Omega) = 1
  3.  P (A+B) = P (A) + P (B) สำหรับ A และ B ที่เป็นสับเซตของ \Omega และ A,B ไม่มีสมาชิกร่วมที่เหมือนกันเลย

อนึ่ง เราจะเรียกแต่ละสมาชิกใน \Omega ว่า เหตุการณ์พื้นฐาน และ สับเซตเช่น A,B ของ \Omega ว่า เหตุการณ์ (ถึงแม้ว่า ไม่ใช่ว่าทุกสับเซตใด ๆ ของ \Omega จะมีคุณสมบัติดังสัจพจน์ข้อที่ 3 แต่ในทางปฏิบัติสับเซตที่เรารู้จักต่างก็มีคุณสมบัติดังนั้นจริง ดูคำอธิบายที่สมบูรณ์ได้ในหัวข้อถัดไป)

สัจพจน์ของความน่าจะเป็นอย่างสมบูรณ์[แก้]

นักคณิตศาสตร์หลายท่านมอง ทฤษฎีความน่าจะเป็น เป็นสาขาย่อยของทฤษฎีการวัด (measure theory). นั่นคือ มอง ความน่าจะเป็น เป็นปริมาณ (แบบนามธรรม) ชนิดหนึ่งที่สามารถวัดได้ในบริบทของทฤษฎีการวัด. ข้อดีของการใช้ทฤษฎีการวัดในการอธิบายทฤษฎีความน่าจะเป็น คือ เรามีทฤษฎีการวัดทั้งในเซตจำกัดและเซตอนันต์. ดังนั้นนักคณิตศาสตร์จึงสามารถขยายทฤษฎีความน่าจะเป็นให้กว้างขึ้น ครอบคลุมไปถึงกรณีที่โดเมนของฟังก์ชันความน่าจะเป็นเป็นเซตอนันต์ได้ทันที โดยอ้างอิงจากทฤษฎีบทที่มีอยู่แล้วในทฤษฎีการวัด.

ในบริบทของทฤษฏีการวัด, ฟังก์ชันความน่าจะเป็นอธิบายได้ดังนี้

ค่าความน่าจะเป็น \mathbb{P} ของเหตุการณ์(event)  \mathbf{E} , \mathbb{P} (\mathbf{E}) ขึ้นกับ "เอกภพสัมพัทธ์"(universe) หรือ "ปริภูมิของการสุ่ม"(sample space)  \boldsymbol{\Omega} ของเหตุการณ์พื้นฐาน ทั้งหมดที่เกิดขึ้นได้ และ \mathbb{P} นั้นจะต้องมีคุณสมบัติตามสัจพจน์ของความน่าจะเป็น

ภายใต้บริบทของทฤษฎีการวัด ปริภูมิความน่าจะเป็น  ( \boldsymbol{\Omega} ,\mathfrak{F} , \mathbb{P}) นิยามโดยมีฟังก์ชันการวัด \mathbb{P} เป็นฟังก์ชันการวัดที่ไม่เป็นลบบน ซิกม่าแอลจีบรา (σ-algebra) หรือ ซิกม่าฟิลด์ (σ-field) \mathfrak{F} ของทุกสับเซต ของ \boldsymbol{\Omega} โดยที่ \mathbb{P} (\boldsymbol{\Omega}) =1

หมายเหตุ: พยายามรักษารูปแบบการนำเสนอเดิมของ คอลโมโกรอฟ แต่มีการเปลี่ยนตัวแปรและเครื่องหมายที่ใช้

สัจพจน์ของคอลโมโกรอฟ[แก้]

ถ้า \boldsymbol{\Omega} เป็น เชตของเหตุการณ์พื้นฐานของการสุ่ม

  1. \mathfrak{F} เป็น ซิกมาฟิลด์ (σ-field) ที่นิยามบน \boldsymbol{\Omega}
  2. สำหรับทุกๆ \mathbf{A} ใน \mathfrak{F} ค่าความน่าจะเป็น \mathbb{P} (\mathbf{A}) จะนิยามเป็นฟังก์ชันจำนวนจริง และมีค่าไม่เป็นจำนวนลบ บน \mathfrak{F}
  3. \mathbb{P} (\boldsymbol{\Omega}) =1
  4. ถ้า \mathbf{A} และ \mathbf{B} เป็นสองเหตุการณ์ที่ไม่เกี่ยวเนื่องกัน (disjoint events) แล้ว  \mathbb{P} (\mathbf{A} \cup \mathbf{B}) = \mathbb{P} (\mathbf{A}) +\mathbb{P} (\mathbf{B})
  5. (สมมติฐานความต่อเนื่อง หรือ ความสมบูรณ์ของการบวก (σ-field)) ถ้า  \mathbf{A_1,A_2,}\ldots\mathbf{,A_n,}\ldots เป็นลำดับของเหตุการณ์ใน \mathfrak{F} โดยที่  \mathbf{A_1}\supset \mathbf{A_2} \supset \ldots \supset \mathbf{A_n} \supset \ldots แล้ว
    •  \bigcap_{n} \mathbf{A_n} = \varnothing
    • ซึ่งก็คือ  \lim_{n \to \infty}\mathbb{P} (\mathbf{A_n}) =0

และจากข้อ 4 และ ข้อ 5 เราสามารถพิสูจน์ได้ว่า  P (\bigcup_{n=1}^\infty \mathbf{A_n}) = \sum_{n=1}^\infty P (A_n)

คำอธิบายอย่างไม่เป็นทางการ[แก้]

ในส่วนที่เราทุกคนรู้กันเป็นอย่างดีเกี่ยวกับความน่าจะเป็นก็คือ หากเรามีเหตุการณ์  \mathbf{A} ใดๆ ค่าความน่าจะเป็นของเหตุการณ์นั้นจะมีค่า 0 \leq \mathbb{P} (\mathbf{A}) \leq 1 และ ค่าความน่าจะเป็นของเหตุการณ์ที่เป็นไปได้ทั้งหมด \mathbb{P} (\boldsymbol{\Omega}) =1

สัจพจน์ของคอลโมโกรอฟข้างต้น นอกเหนือจากจะกล่าวถึง คุณสมบัติของฟังก์ชันการกำหนดค่าความน่าจะเป็นแล้ว ยังได้ระบุถึงโครงสร้างของสิ่งที่ค่าความน่าจะเป็นจะถูกระบุลงไปอีกด้วย คือ ปริภูมิของเหตุการณ์ (event space) ในแบบจำลองทางคณิตศาสตร์ของความน่าจะเป็น ปริภูมิของเหตุการณ์ ประกอบด้วย สับเซต ทั้งหมดของ ปริภูมิของการสุ่ม \boldsymbol{\Omega} ที่เราสามารถระบุค่าความน่าจะเป็นได้ โดยปกติแล้วเราอาจไม่สามารถระบุค่าความน่าจะเป็นของทุกสับเซตของ \boldsymbol{\Omega} ได้ สับเซตที่ระบุค่าความน่าจะเป็นได้นี้อธิบายในสัจพจน์ข้างต้นด้วย ฟิลด์ และ ซิกม่าฟิลด์

ปกติเราสามารถสร้างเหตุการณ์ที่ซับซ้อนขึ้นจากเหตุการณ์อื่นๆ ด้วยการใช้ตัวดำเนินการทางเซต เช่น หากเราพิจารณาแบบจำลองของการโยนลูกเต๋า 1 ลูก โดยมีปริภูมิของการสุ่ม \boldsymbol{\Omega} = \{1,2,3,4,5,6 \}

  • เหตุการณ์ของการโยนออกแต้มเลขคี่ คือ \{1,3,5\} = \{1\} \cup \{3\} \cup \{5\}
  • เหตุการณ์ของการออกแต้มน้อยกว่า 4 คือ \{1,2,3\} = \{1\} \cup \{2\} \cup \{3\}
  • เหตุการณ์ของการออกแต้มไม่น้อยกว่า 4 คือ  \{1,2,3\}^c = \{4,5,6\}
  • เหตุการณ์ของการออกแต้มน้อยกว่า 4 และ เป็นเลขคี่ คือ \{1,3,5\} \cap \{1,2,3\} = \{1,3\}
  • เหตุการณ์ของการออกแต้มน้อยกว่า 4 หรือ เป็นเลขคี่ คือ \{1,3,5\} \cup \{1,2,3\} = \{1,2,3,5\}

เพราะฉะนั้น ผลลัพธ์จากการดำเนินการทางเซต จะได้ผลลัพธ์เป็นเหตุการณ์ คือ เป็นสับเซตที่สามารถระบุความน่าจะเป็นได้ มีคุณสมบัติปิดภายใต้การดำเนินการทางเซต

ตัวอย่าง พิจารณา \boldsymbol{\Omega} = \{1,2,3,4\} หากเราสามารถระบุค่าความน่าจะเป็นของเหตุการณ์  \mathbf{A} = \{1,2,3\} และ  \mathbf{B} = \{3,4\} ได้ สับเซตทั้งหมดที่สามารถหาค่าความน่าจะเป็นได้ คือ ฟิลด์ ที่กำเนิดจากเหตุการณ์ทั้งสองข้างต้นคือ

 \emptyset \quad \mathbf{A}\cap\mathbf{B}=\{3\} \quad \mathbf{A}^c\cap\mathbf{B}=\{4\} \quad \mathbf{B}^c=\mathbf{A}\cap\mathbf{B}^c=\{1,2\} \quad \mathbf{B}=\{3,4\} \quad \mathbf{A}=\{1,2,3\} \quad \boldsymbol{\Omega}

สังเกตว่า เหตุการณ์  \{1\} และ  \{2\} นั้นไม่ได้อยู่ในปริภูมิของเหตุการณ์ และ ไม่สามารถระบุค่าความน่าจะเป็นได้

ในกรณีของเหตุการณ์ นับได้จำนวนไม่จำกัด เช่น การโยนเหรียญจำนวนอินฟินิตีครั้ง ปริภูมิของเหตุการณ์จะอธิบายด้วย ซิกมาฟิลด์ ซึ่งเป็นกลุ่มของสับเซตของปริภูมิของการสุ่ม ที่มีคุณสมบัติปิดภายใต้ การดำเนินการทางเซต นับได้ จำนวนไม่จำกัด

ดูบทความหลักที่: ฟิลด์ และ ซิกม่าฟิลด์

หมายเหตุ[แก้]

1 แม้ว่าคณิตศาสตร์ของความน่าจะเป็นจะถูกพัฒนาขึ้นตั้งแต่มานานตั้งแต่ ปิแยร์ แฟร์มาต์ แบลส์ ปาลกาล จนถึง ปิแยร์ ซิมง ลาปลัสก็ตาม นักคณิตศาสตร์เหล่านี้ไม่ได้กำหนดโครงสร้างทางคณิตศาสตร์ของความน่าจะเป็นอย่างเคร่งครัด คล้ายกับกรณีออกัสติน หลุยส์ โคชี่ได้นิยามแคลคูลัสของไอแซก นิวตัน กับ กอทท์ฟรีด ไลบ์นิซอย่างเคร่งครัดในคริสต์ศตวรรษที่ 19 นั่นเอง

2 อนึ่ง ในบทความนี้ได้กล่าวว่า ในทางปฏิบัติโดยทั่วไป สัจพจน์ของทั้งสามท่านได้ให้ผลลัพธ์เช่นเดียวกัน ในทางปฏิบัติ ในที่นี้หมายถึงกรณีที่โดเมนของฟังก์ชันความน่าจะเป็น เป็นเซตจำกัด ทำให้ประเด็นเรื่อง การบวกได้เชิงเซตจำกัด (finite additivity) และ การบวกได้เชิงเซตอนันต์นับได้ (countably additivity) ของทฤษฎีการวัดไม่ส่งผลต่อการใช้งานสัจพจน์. ในหนังสือของเอดวิน ทอมป์สัน เจนส์ (Jaynes, 2003) ได้วิเคราะห์ความเหมือน ความแตกต่าง แนวคิด และปรัชญา ของคอลโมโกรอฟ, เด ฟิเนตติ และคอกซ์ ไว้อย่างละเอียดในภาคผนวก รวมทั้งยังนำเสนอวิธีการสังเคราะห์สัจพจน์ของคอกซ์อย่างละเอียดจาก ความต้องการพื้นฐานที่สมเหตุสมผล ของทฤษฏีความน่าจะเป็นแบบเบย์อีกด้วย

อ้างอิง[แก้]

  1. Kolmogorov, A. N. (Andrei Nikolaevich) , Foundations of the theory of probability; translation edited by Nathan Morrison, New York, Chelsea Pub. Co., 1950.
  2. de Finetti, B., Probability, induction and statistics: The art of guessing, John Wiley & Sons Ltd., 1972.
  3. Jaynes, E.T. (2003) Probability Theory : The Logic of Science.