ขอบเขตเชอร์นอฟ
| บทความนี้ไม่มีการอ้างอิงจากเอกสารอ้างอิงหรือแหล่งข้อมูล โปรดช่วยพัฒนาบทความนี้โดยเพิ่มแหล่งข้อมูลน่าเชื่อถือ เนื้อหาที่ไม่มีการอ้างอิงอาจถูกคัดค้านหรือนำออก |
ขอบเขตเชอร์นอฟ (อังกฤษ: Chernoff bound) ตั้งตามชื่อของ เฮอร์มาน เชอร์นอฟ (Herman Chernoff) ในทฤษฎีความน่าจะเป็น จะเป็นกลุ่มของข้อความทางคณิตศาสตร์ที่ให้ขอบเขตบนของส่วนปลายของการกระจายความน่าจะเป็น ชื่อของอสมการนั้นตั้งเพื่อเป็นเกียรติแก่ เฮอร์แมน เชอร์นอฟ นักคณิตศาสตร์ สถิติ และฟิสิกส์ ชาวอเมริกัน ขอบเขตเชอร์นอฟใช้ข้อมูลจากโมเมนต์ทั้งหมดของตัวแปรสุ่ม ดังนั้นโดยทั่วไปแล้วจึงให้ขอบเขตที่กระชับกว่าอสมการของมาร์คอฟ (ในรูปพื้นฐาน) และอสมการของเชบิเชฟมาก
เนื้อหา |
รูปทั่วไป [แก้]
ให้
เป็นตัวแปรสุ่มใดๆ แล้ว
โดยที่
คือ ฟังก์ชันกำเนิดโมเมนต์ (moment generating function)
การพิสูจน์ [แก้]
สำหรับค่าคงที่บวก
ใดๆ
เป็นฟังก์ชันเพิ่มที่มีค่าบวกเสมอ ดังนั้น
ก็ต่อเมื่อ 
เมื่อมอง
เป็นตัวแปรสุ่มและใช้อสมการของมาร์คอฟ เราได้ว่า
เนื่องจากข้อความข้างต้นเป็นจริงสำหรับทุกๆ จำนวนจริงบวก
มันจึงเป็นจริงสำหรับ
ที่ทำให้
มีค่าต่ำสุดด้วย เพราะฉะนั้น
ตามต้องการ
ขอบเขตเชอร์นอฟของการทดลองแบบปัวซอง [แก้]
ในส่วนนี้จะกล่าวถึงการหาขอบเขตเชอร์นอฟในกรณีที่ที่ตัวแปรสุ่มอันเป็นผลบวกของการทดลองแบบปัวซองซึ่งเป็นอิสระแก่กัน กรณีพิเศษของขอบเขตเชอร์นอฟแบบนี้ถูกใช้อย่างแพร่หลายในการวิเคราะห์ขั้นตอนวิธีแบบสุ่ม โดยเฉพาะในการพิสูจน์ว่าขั้นตอนวิธีแบบสุ่มหนึ่งๆ จะทำงานได้ดีด้วยความน่าจะเป็นสูง สาเหตุที่ขอบเขตเชอร์นอฟเป็นเทคนิคที่เหมาะสมต่อการวิเคราะห์ขั้นตอนวิธีแบบสุ่มนั้น อาจเพราะว่า โดยทั่วไปเราสามารถมองขั้นตอนวิธีแบบสุ่มว่า เป็นขั้นตอนวิธีที่ใช้การโยนเหรียญที่เป็นอิสระต่อกันหลาย ๆ ครั้งในการตัดสินใจ
ขอบเขตของเชอร์นอฟในกรณีนี้นั้นไม่สมมาตร ดังนั้นในการใช้งานจะมีขอบเขตทั้งของ ส่วนปลายด้านบน ซึ่งจะใช้สำหรับกรณีที่ต้องการหาขอบเขตบนในกรณีที่ตัวแปรสุ่มมีค่ามากกว่าค่าคาดหมาย และ ส่วนปลายด้านล่าง ในกรณีที่พิจารณาเหตุการณ์ที่ตัวแปรสุ่มมีค่าน้อยกว่าค่าคาดหมาย
ใจความ [แก้]
ให้
เป็นจำนวนเต็มบวก และ
สำหรับจำนวน
เป็นการทดลองแบบปัวซองที่เป็นอิสระแก่กันโดยที่
และ
กำหนด
และให้
และ
เป็นจำนวนจริงใดๆ ที่มีค่ามากกว่า 0 แล้ว:
1. (ส่วนปลายด้านบน)
2. (ส่วนปลายด้านล่าง) เมื่อ 
การพิสูจน์ [แก้]
เราเริ่มจากการพิสูจน์ส่วนปลายด้านบน จากรูปทั่วไป
พิจารณา
เราได้ว่า
เนื่องจากตัวแปรสุ่ม
,
,
,
เป็นอิสระแก่กัน เราได้ว่า
เพราะว่า
สำหรับจำนวนจริงบวก
ทุกจำนวน เราได้ว่า
เนื่องจาก
ดังนั้น
กำหนดฟังก์ชัน
เราได้ว่า
และ 
สมมติให้
เราได้ว่า
และ
เพราะฉะนั้น
จึงมีค่าต่ำสุดสัมบูรณ์ที่
เราจึงได้ว่า
ตามต้องการ
สำหรับส่วนปลายด้านล่างนั้น เราเริ่มจากสังเกตว่า
ก็ต่อเมื่อ
เมื่อใช้รูปทั่วไปของขอบเขตเชอร์นอฟ ได้ว่า
เมื่อใช้การให้เหตุผลแบบเดียวกับการพิสูจน์ส่วนปลายด้านบน เราได้ว่า
ค่าต่ำสุดของฟังก์ชันทางด้านขวามือของอสมการอยู่ที่
ฉะนั้น
ตามต้องการ
รูปแบบอื่น ๆ [แก้]
รูปแบบทั้งสองข้างต้นเป็นรูปแบบที่ให้ขอบเขตที่แน่นที่สุดของขอบเขตเชอร์นอฟ อย่างไรก็ตาม รูปแบบทั้งสามแบบด้านล่างที่อาจมีเงื่อนไขเพิ่มเติม มักนำไปใช้ได้สะดวกกว่า
1. (ส่วนปลายด้านบน) ถ้า 
และ สำหรับ 
2. (ส่วนปลายด้านล่าง) ถ้า 
![\Pr[X \geq a] \ \leq \ \inf_{t > 0} e^{-ta} \mathcal{M}_X(t)](http://upload.wikimedia.org/math/8/a/0/8a06c48c0d87731dbabdb2f537006d16.png)
คือ ![\Pr[X \geq a] = \Pr[e^{tX} \geq e^{ta}] \leq \frac{\mathrm{E}[e^{tX}]}{e^{ta}} = e^{-ta}\mathcal{M}_X(t)](http://upload.wikimedia.org/math/a/7/c/a7ca59d6993572729b82977e0f7ff1d3.png)
![\Pr[X \geq a] \leq \inf_{t > 0} e^{-ta}\mathcal{M}_X(t)](http://upload.wikimedia.org/math/5/d/1/5d1a0c620969f0fa4f297658db0c2f7e.png)
![\Pr[X > (1+\delta)\mu] < \left( \frac{e^\delta}{(1+\delta)^{1+\delta}} \right)^\mu](http://upload.wikimedia.org/math/5/1/3/5130be764abde6822367b1f71071ed4f.png)
![\Pr[X > (1-\delta)\mu] < \left( \frac{e^\delta}{(1-\delta)^{1-\delta}} \right)^\mu](http://upload.wikimedia.org/math/c/d/3/cd33cf121af39dec6baa7f92b93f030c.png)
![\Pr[X > (1+\delta)\mu] < \inf_{t > 0} e^{-t(1+\delta)\mu}\mathcal{M}_X(t)](http://upload.wikimedia.org/math/6/9/8/6981fca4df396e63fa030e3111451899.png)
![\mathcal{M}_X(t) = \mathrm{E}[\prod_{i=1}^n e^{tX_i}] = \prod_{i=1}^n \mathrm{E}[e^{tX_i}] = \prod_{i=1}^n (p_ie^t + (1-p_i)) = \prod_{i=1}^n (1 + p_i(e^t - 1))](http://upload.wikimedia.org/math/f/e/9/fe922142945f5414df610ab71e7cb834.png)


![\Pr[X > (1+\delta)\mu] < \inf_{t > 0} e^{-t(1+\delta)\mu}\mathcal{M}_X(t) < \inf_{t > 0} f(t)^\mu = f(\ln(1+\delta))^\mu = \left( \frac{e^\delta}{(1+\delta)^{1+\delta}} \right)^\mu](http://upload.wikimedia.org/math/7/c/6/7c6e4ab5a8d6f7aef5ea87b8263b8ad5.png)
![\Pr[X < (1-\delta)\mu] < \inf_{t > 0} e^{(1-\delta)\mu}\mathrm{E}[e^{-tX}]](http://upload.wikimedia.org/math/8/4/6/8460428184862c69cc08d81393097bcb.png)
![\Pr[X < (1-\delta)\mu] < \inf_{t > 0} \left( \frac{e^{e^{-t}-1}}{e^{-t(1-\delta)}} \right)^\mu](http://upload.wikimedia.org/math/4/a/e/4ae5aad1ec4f3ed1016d8a14317347d9.png)
![\Pr[X < (1-\delta)\mu] < \left( \frac{e^\delta}{(1-\delta)^{1-\delta}} \right)^\mu](http://upload.wikimedia.org/math/b/8/0/b80f70c7bf294a82b3a3b690423da34e.png)
![\Pr[X > (1+\delta)\mu] < e^{-\mu\delta^2/4}](http://upload.wikimedia.org/math/0/d/5/0d53cf0ec700bf8f6ad5678499df1c36.png)
![\Pr[X > (1+\delta)\mu] < 2^{-(1+\delta)\mu}](http://upload.wikimedia.org/math/4/3/6/436ed92f735e08b236020e2400577546.png)
![\Pr[X < (1-\delta)\mu] < e^{-\mu\delta^2/2}](http://upload.wikimedia.org/math/1/6/b/16becb3810165f9acceaf482e5ad7de7.png)