หลักการของออคแคม

จากวิกิพีเดีย สารานุกรมเสรี

หลักการของออคแคม (Ockham's Razor หรือ Occam's Razor) ถูกเสนอโดย วิลเลียมแห่งออคแคม เป็นหลักการหนึ่งในปรัชญาวิทยาศาสตร์ ในการเลือกทฤษฎีที่เหมาะสม และตรงกับข้อมูล ที่ได้จากการสังเกต หรือการทดลอง

หลักการของออคแคมนี้ ถูกนำไปตีความในหลายรูปแบบ โดยนักปรัชญา และนักวิทยาศาสตร์หลายท่าน อย่างไรก็ตาม เราอาจกล่าวถึงหลักการของออคแคม ในรูปแบบที่ง่ายที่สุด ได้ดังนี้: "เราไม่ควรสร้างข้อสมมุติฐานเพิ่มเติมโดยไม่จำเป็น" หรือ "ทฤษฎีไม่ควรซับซ้อนเกินความจำเป็น"

นั่นคือในกรณีที่ทฤษฎี หรือคำอธิบายปรากฏการณ์ต่างๆ มากกว่าหนึ่งรูปแบบ สามารถอธิบาย และทำนาย สิ่งที่ได้จากการสังเกตทดลอง ได้เท่าเทียมกัน หรือไม่ต่างกันมาก เราควรจะเลือกทฤษฎีที่ง่ายที่สุด หรือซับซ้อนน้อยที่สุดนั่นเอง

หลักการนี้ ได้รับการสนับสนุนอย่างหนักแน่น จากนักวิทยาศาสตร์ชื่อดังหลายท่าน ไม่ว่าจะเป็น อัลเบิร์ต ไอน์สไตน์ หรือ กาลิเลโอ กาลิเลอี ที่มองธรรมชาติเป็นสิ่งที่สวยงามดั่งศิลปะ (ดูเรื่องความสวยงาม ในมุมมองของนักคณิตศาสตร์ ได้ในหัวข้อ นักคณิตศาสตร์)

เนื้อหา

[แก้] ตัวอย่างการนำไปใช้

ตัวอย่างที่ดีที่สุด ในการใช้หลักการของออคแคมคือ การที่นักวิทยาศาสตร์ชั้นนำ ในยุคฟื้นฟูศิลปะวิทยาการ เชื่อถือว่า ทฤษฎีของโคเปอร์นิคัส นั้น น่าเชื่อถือมากกว่า ทฤษฎีโลกเป็นศูนย์กลาง ของ อริสโตเติล และ ทอเลมี

ไฟล์:Geo vs helio.JPG
ในรูป แสดงการโคจรของโลก และดาวพุธ. โดยด้านซ้าย แสดงโมเดลแบบ ดวงอาทิตย์เป็นศูนย์กลาง, ส่วนด้านขวา แสดงโมเดลแบบ โลกเป็นศูนย์กลาง. ทั้งสองโมเดล ให้ความถูกต้องใกล้กัน แต่โมเดลแบบแรก เรียบง่ายกว่ามาก. ภาพนี้สร้างขึ้นจาก Java applet ที่เว็บไซต์ venus-transit.de

ในงานวิจัยด้านการเรียนรู้ของเครื่องในปัจจุบัน ได้นำหลักการของออคแคมมาใช้อย่างกว้างขวาง (ดู (Duda et al., 2001), (Mitchel, 1997) และ (Mackay, 2003)) แต่มักจะเข้าใจผิดว่า ทฤษฎีที่มีคำอธิบายสั้น คือทฤษฎีที่เรียบง่ายกว่า (ดูหัวข้อความเข้าใจผิดที่พบบ่อย)

อนึ่ง หลักการของออคแคมนี้ สามารถคำนวณออกมาในเชิงตัวเลข (หรือในเชิงปริมาณ ซึ่งสามารถสื่อสารกันได้อย่างเที่ยงตรงมากกว่าเชิงคุณภาพ) ได้ด้วยการใช้ทฤษฎีความน่าจะเป็นแบบเบย์ ในการอนุมาน (ดู (Mackay, 2003) และ (Jaynes, 2003)) โดยมีหลักการว่าโมเดลที่ซับซ้อนมาก จะมีตัวแปร (ในศัพท์ของทฤษฎีความน่าจะเป็นและสถิติมักเรียก "ตัวแปร" ที่ปรับได้นี้ ว่า "พารามีเตอร์") จำนวนมาก เพื่อให้ปรับค่าได้ยืดหยุ่นมาก ดังนั้นความน่าจะเป็นที่ตัวแปรจำนวนมากนั้น จะปรากฏเป็นค่าที่เข้ากับข้อมูลของเราได้อย่างลงตัวนั้นจึง "น้อย" กว่าโมเดลที่มีตัวแปรน้อย

[แก้] ความเข้าใจผิดที่พบบ่อย

  1. "โมเดลที่ง่าย จะให้ความถูกต้องเหมาะสมกับข้อมูล มากกว่าโมเดลที่ซับซ้อน" ประโยคนี้ไม่เป็นจริง โดยทั่วไปโมเดลที่ซับซ้อน (มีพารามีเตอร์มากกว่า) จะให้ความถูกต้องกับข้อมูลไม่ด้อยกว่าโมเดลที่เรียบง่าย หลักการของออคแคม แนะนำให้เลือกโมเดลที่ง่าย ในกรณีที่โมเดลที่ซับซ้อน ให้ความถูกต้องได้ไม่ดีกว่าอย่างเห็นได้ชัดเท่านั้น
  2. "โมเดลที่มีคำอธิบายสั้นกว่า คือโมเดลที่ซับซ้อนน้อยกว่า" ประโยคนี้ไม่เป็นจริงเสมอไป เนื่องจากความสั้นยาวของคำอธิบายของโมเดล ขึ้นอยู่กับการเข้ารหัส หรือภาษาที่ใช้อธิบายโดยตรง ดังเช่นในทางคณิตศาสตร์ ถ้าเราจำกัดให้ภาษาของสมการของเรา มีเพียงสมการพหุนามแล้ว เราจำเป็นต้องใช้พจน์ของพหุนามเป็นจำนวนอนันต์ เพื่ออธิบายฟังก์ชันเอกโปเน็นเชียล ในขณะที่ ถ้าภาษาของเรามีค่าคงที่ e เราก็จะสามารถอธิบายฟังก์ชันเอกโปเน็นเชียลได้ ด้วยตัวอักษรไม่กี่ตัว อย่างไรก็ตาม แม้ความยาวของทั้งสองสมการจะไม่เท่ากัน แต่สมการทั้งสองก็อธิบายโมเดลเดียวกัน ความยาวของคำอธิบาย จึงไม่สามารถบอกค่าความซับซ้อนของโมเดลได้โดยตรง

อนึ่งในการวัดความเรียบง่ายของ "โมเดล" จาก "คำอธิบายโมเดล" โดยตรง เราจำเป็นต้องใช้การเข้ารหัสแบบครอบจักรวาล (universal encoding) เพื่ออธิบายโมเดลนั้น งานวิจัยในด้านการวัดความซับซ้อนของโมเดลแบบสัมบูรณ์นี้ คืองานวิจัยเรื่องความซับซ้อนแบบโคโมลโกรอฟ ซึ่งถูกเสนอโดยนักคณิตศาสตร์ชื่อดังชาวรัสเซีย แอนเดร โคลโมโกรอฟ ในราวปี ค.ศ. 1960

[แก้] ดูเพิ่ม

[แก้] อ้างอิง

  • Morris Kilne. Mathematics for the Non-mathematician. Dover Publication, 1985. อ้างอิงเกี่ยวกับการปฏิวัติของโคเปอร์นิคัส
  • E. T. Jaynes, Chapter 24 in Probability Theory - The logic of science , 1994. เหมาะสำหรับผู้เชี่ยวชาญ
  • David J.C. MacKay (2003) Information theory, inference and learning algorithms, CUP, ISBN 0521642981, (also available online) เหมาะสมสำหรับผู้เริ่มต้น
  • Domingos, P., "The role of Occam's razor in knowledge discovery," Data Mining and Knowledge Discovery, 3(4): 409-425, 1999. อิงข้อผิดพลาดที่มักพบบ่อยแบบที่ 1
  • Richard O. Duda, Peter E. Hart, David G. Stork (2000) Pattern classification (2nd edition), Section 9.6.5, p. 487-489, Wiley, ISBN 0471056693 ถอดเนื้อหามาจากงานของ Mackay
  • Tom Mitchell. Machine Learning, 1997. หนังสือการเรียนรู้ของเครื่องฉบับมาตรฐานเล่มนี้นำหลักการของออคแคมมาพูดถึงได้เข้าใจง่าย แต่มีข้อเสียคือไม่พูดถึงประเภทของการเข้ารหัส ซึ่งอาจจะทำให้เข้าใจหลักการของออคแคมผิดได้ (ว่าโมเดลที่มีคำอธิบายสั้นคือโมเดลที่เรียบง่าย)

[แก้] แหล่งข้อมูลอื่น

เครื่องมือส่วนตัว