การเรียนรู้แบบมีผู้สอน
ส่วนหนึ่งของเนื้อหา |
การเรียนรู้ของเครื่อง และ การทำเหมืองข้อมูล |
---|
การเรียนรู้แบบมีผู้สอน (อังกฤษ: supervised learning)เป็นรูปแบบการเรียนรูปแบบหนึ่งของการเรียนรู้ของเครื่องที่จับคู่ระหว่างข้อมูลป้อนเข้าและข้อมูลขาออกตามพื้นฐานตัวอย่าง[1] การทำงานอ้างอิงจากชุดข้อมูลฝึกฝน (training data set) ซึ่งประกอบด้วยชุดข้อมูลตัวอย่าง[2]
การเรียนรู้แบบมีผู้สอนเป็นเทคนิคการเรียนรู้ของเครื่องซึ่งสร้างฟังก์ชันจากข้อมูลฝึกฝน ข้อมูลฝึกฝนประกอบด้วยข้อมูลป้อนเข้า (มักจะเป็น เวกเตอร์) และผลที่ต้องการ ผลจากการเรียนรู้จะเป็นฟังก์ชันที่อาจจะให้ค่าต่อเนื่อง (จะเรียกวิธีการว่า การถดถอย) หรือ ใช้ทำนายประเภทของวัตถุ (เรียกว่า การจำแนกเชิงสถิติ) ภารกิจของเครื่องเรียนรู้แบบมีผู้สอนคือการทำนายค่าของฟังก์ชันจากข้อมูลป้อนเข้าที่ถูกต้องโดยใช้ตัวอย่างสอนจำนวนน้อย โดยแบบจำลองการเรียนรู้จะต้องทำการวางนัยทั่วไป จากข้อมูลที่มีอยู่ไปยังกรณีที่ไม่เคยพบอย่างมีเหตุมีผล (ดู ความโน้มเอียงเชิงอุปนัย)
การแก้ปัญหาการเรียนรู้แบบมีผู้สอน (เช่น การเรียนรู้เพื่อรู้จำลายมือ) มีขั้นตอนต่าง ๆ ที่ต้องพิจารณา ได้แก่
- กำหนดชนิดของตัวอย่างสอน ก่อนจะเริ่มทำอย่างอื่น จะต้องตัดสินว่าข้อมูลชนิดใดที่จะใช้เป็นตัวอย่าง เช่นในกรณีการรู้จักลายมือ ตัวอย่างอาจจะเป็นตัวอักษรตัวเดียว คำ หรือบรรทัด
- เก็บตัวอย่าง ชุดตัวอย่างสอนจะต้องมีลักษณะเป็นตามที่ใช้จริง ดังนั้นชุดข้อมูลตัวอย่างและผลที่สอดคล้องจะต้องถูกจัดเก็บจากผู้เชี่ยวชาญหรือจากการวัด
- กำหนดวิธีการแทนลักษณะ (feature) ของข้อมูลป้อนเข้า ความถูกต้องของฟังก์ชันจะขึ้นอยู่กับการแทนข้อมูลอย่างมาก โดยทั่วไปข้อมูลป้อนเข้าจะถูกแปลงเป็นเวกเตอร์ของลักษณะ ใช้อธิบายวัตถุที่ต้องการแบ่งประเภท จำนวนลักษณะจะต้องไม่มากจนเกินไป เพราะจะทำให้เกิดปัญหาคำสาปของมิติ เนื่องจากมิติที่กว้างเกินไปจนทำให้มีพื้นที่ว่างมากจนเครื่องเรียนรู้ไม่สามารถวางนัยทั่วไปได้ แต่จำนวนลักษณะก็จะต้องมากพอที่จะทำให้สามารถทำนายผลได้แม่นยำ
- กำหนดโครงสร้างของฟังก์ชันที่ต้องการ และขั้นตอนวิธีการเรียนรู้ที่สอดคล้อง เช่น อาจจะต้องเลือกว่าจะใช้ โครงข่ายประสาทเทียม หรือ การเรียนรู้ต้นไม้ตัดสินใจ
- ทำการออกแบบให้สมบูรณ์ แล้วใช้ขั้นตอนวิธีการเรียนรู้กับตัวอย่างที่เก็บมา อาจจะปรับพารามิเตอร์ต่างๆ ของขั้นตอนวิธีให้เหมาะที่สุดโดยใช้ชุดย่อยของชุดตัวอย่าง เรียกว่า ชุดข้อมูลตรวจสอบ (validation data set) หรือ ใช้การตรวจสอบไขว้ (cross-validation) หลังจากปรับค่าต่างๆ แล้ว อาจจะวัดประสิทธิภาพของขั้นตอนวิธีโดยใช้ชุดข้อมูลทดสอบ (test data set) ซึ่งแยกต่างหากจากชุดสอน
อ้างอิง
[แก้]- ↑ Stuart J. Russell, Peter Norvig (2010) Artificial Intelligence: A Modern Approach, Third Edition, Prentice Hall ISBN 9780136042594.
- ↑ Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar (2012) Foundations of Machine Learning, The MIT Press ISBN 9780262018258.