ข้ามไปเนื้อหา

แบบจำลองเชิงสถิติ

จากวิกิพีเดีย สารานุกรมเสรี

แบบจำลองเชิงสถิติ (statistical model) หรือ แบบจำลองความน่าจะเป็น (probabilistic model) คือ แบบจำลองทางคณิตศาสตร์ ที่รวบรวมชุดสมมติฐานเชิงสถิติเกี่ยวกับการสร้างข้อมูลตัวอย่าง (และข้อมูลที่คล้ายกันจากประชากรเชิงสถิติที่มีขนาดใหญ่กว่า) แบบจำลองเชิงสถิติมักจะแสดงถึงกระบวนการสร้างข้อมูลในลักษณะที่เป็นอุดมคติสูง[1]

โดยทั่วไปแบบจำลองเชิงสถิติมักถูกกำหนดให้เป็นความสัมพันธ์เชิงคณิตศาสตร์ระหว่างตัวแปรสุ่ม ตั้งแต่หนึ่งตัวขึ้นไปกับตัวแปรที่ไม่สุ่มตัวอื่น ๆ แบบจำลองเชิงสถิติถือเป็นการอธิบายทฤษฎีอย่างเป็นระบบระเบียบ[2]

การทดสอบสมมติฐานในเชิงสถิติทั้งหมดและ ตัวประมาณค่าในเชิงสถิติทั้งหมดได้มาจากแบบจำลองเชิงสถิติ โดยทั่วไปแล้ว แบบจำลองเชิงสถิติเป็นส่วนหนึ่งของรากฐานของการอนุมานเชิงสถิติ

การใช้งาน

[แก้]

แบบจำลองเชิงสถิติถือได้ว่าเป็นสมมติฐานเชิงสถิติที่มีลักษณะพิเศษคือสามารถคำนวณความน่าจะเป็นของเหตุการณ์บางอย่างได้ ตัวอย่างเช่น พิจารณาการทอยลูกเต๋าปกติ (มี 6 ด้าน) 2 ลูก พิจารณาสมมติฐานเชิงสถิติที่แตกต่างกัน 2 ข้อเกี่ยวกับการทอยลูกเต๋า

สมมติฐานเชิงสถิติประการแรก: สำหรับการทอยแต่ละครั้ง ความน่าจะเป็นที่แต่ละด้านของลูกเต๋า (1, 2, 3, 4, 5 และ 6) จะปรากฏคือ จากสมมติฐานนี้ ความน่าจะเป็นที่ลูกเต๋าทั้ง 2 ลูกจะเท่ากับ 5 คำนวณได้เป็น

โดยทั่วไป เราสามารถคำนวณความน่าจะเป็นของเหตุการณ์ใด ๆ เช่น (1 และ 2), (3 และ 3), (5 และ 6) เป็นต้น

ข้อสันนิษฐานเชิงสถิติอีกประการหนึ่ง: สำหรับการทอยแต่ละครั้ง ความน่าจะเป็นที่การทอยลูกเต๋าคือ 5 คือ (เพราะลูกเต๋าถูกสร้างขึ้นมาแบบพิเศษ) จากสมมติฐานนี้ ความน่าจะเป็นที่ลูกเต๋าทั้งสองลูกจะออกมาเป็น 5 มีการคำนวณดังนี้

อย่างไรก็ตาม เรายังไม่ทราบความน่าจะเป็นที่หน้าอื่น ๆ จะปรากฏขึ้น และไม่สามารถคำนวณความน่าจะเป็นของเหตุการณ์ในรายละเอียดปลีกย่อยได้

สมมติฐานเชิงสถิติข้อแรกถือเป็นแบบจำลองเชิงสถิติ เนื่องจากความน่าจะเป็นของเหตุการณ์ใด ๆ สามารถคำนวณได้โดยใช้เพียงสมมติฐานนี้ ข้อสันนิษฐานเชิงสถิติอีกประการหนึ่งไม่ถือเป็นแบบจำลองเชิงสถิติ เนื่องจากไม่สามารถคำนวณความน่าจะเป็นของเหตุการณ์ใด ๆ ตามสมมติฐานนั้นเพียงอย่างเดียวได้

ในตัวอย่างข้างต้น เมื่อพิจารณาจากสมมติฐานเบื้องต้นแล้ว เราสามารถคำนวณความน่าจะเป็นของเหตุการณ์ได้อย่างง่ายดาย อย่างไรก็ตาม ในบางกรณี การคำนวณอาจทำได้ยากหรือทำไม่ได้เลย (เช่น ต้องใช้การคำนวณนานกว่าล้านปี) ปัญหาดังกล่าวเป็นที่ยอมรับได้ตราบเท่าที่กระบวนการนี้ถือเป็นแบบจำลองเชิงสถิติได้ การคำนวณไม่จำเป็นต้องใช้งานได้จริง ตราบใดที่เป็นไปได้ในทางทฤษฎี

อ้างอิง

[แก้]
  1. Cox 2006
  2. Adèr 2008, p. 280