การแบ่งประเภทข้อมูล
จากวิกิพีเดีย สารานุกรมเสรี
ในวิทยาการคอมพิวเตอร์ การแบ่งประเภทข้อมูล (อังกฤษ: data classification) เป็นปัญหาพื้นฐานของการเรียนรู้แบบมีผู้สอน โดยปัญหาคือการทำนายประเภทของวัตถุจากคุณสมบัติต่าง ๆ ของวัตถุ ซึ่งการเรียนรู้แบบมีผู้สอนจะสร้างฟังก์ชันเชื่อมโยง ระหว่างคุณสมบัติของวัตถุ กับประเภทของวัตถุจากตัวอย่างสอน แล้วจึงใช้ฟังก์ชันนี้ทำนายประเภทของวัตถุที่ไม่เคยพบ เครื่องมือหรือขั้นตอนวิธีที่ใช้สำหรับการแบ่งประเภทข้อมูลเช่น โครงข่ายประสาทเทียม ต้นไมตัดสินใจ
นิยามของปัญหา[แก้]
กำหนดตัวอย่างสอน
ให้
เป็นเวกเตอร์แสดงคุณสมบัติของวัตถุ ซึ่ง
โดยที่
เป็นเซตจำกัดระบุคุณสมบัติ และ
เป็นประเภทของวัตถุ ซึ่งกำหนดไว้ในเซตจำกัด
ต้องการหาฟังก์ชัน
ซึ่งให้ค่า
จากเวกเตอร์
ที่กำหนด โดยที่ความผิดพลาดของการทำนายตัวอย่างสอนมีค่าน้อยที่สุด หรือมีค่า
น้อยที่สุด โดยกำหนด
ซึ่ง 