การลดมิติ
ส่วนหนึ่งของเนื้อหา |
การเรียนรู้ของเครื่อง และ การทำเหมืองข้อมูล |
---|
การลดมิติ (Dimensionality reduction) ในสาขาการเรียนรู้ของเครื่องและสถิติศาสตร์ หมายถึงกระบวนการลดจำนวนของตัวแปรสุ่ม และได้ชุดของตัวแปรหลักที่ไม่มีความสัมพันธ์กัน ภายใต้เงื่อนไขที่จำกัดบางประการ[1] การลดมิติสามารถแบ่งย่อยได้เป็นสองวิธีใหญ่ ๆ คือ การคัดเลือกตัวแปร และ การสกัดลักษณะเฉพาะ
การคัดเลือกตัวแปร[แก้]
ในการคัดเลือกตัวแปร จะเริ่มจากพิจารณาว่าข้อมูลมีตัวแปรซ้ำซ้อนหรือไม่เกี่ยวข้องจำนวนมาก (หรือคุณสมบัติ คุณลักษณะ ตัวบ่งชี้ ฯลฯ) และจุดมุ่งหมายคือการค้นหาตัวแปรหลักจากชุดตัวแปรดั้งเดิม เอกสารงานวิจัยส่วนใหญ่เกี่ยวกับการเลือกตัวแปรในสถิติสมัยใหม่มุ่งเน้นไปที่สถิติมิติสูง (High-dimensional statistics) ในจำนวนนั้น วิธีการที่พบได้บ่อย ได้แก่:
การสกัดลักษณะเฉพาะ[แก้]
การสกัดลักษณะเฉพาะ ถือได้ว่าเป็นวิธีการทั่วไปในการเลือกตัวแปร: การเลือกตัวแปร ถือว่ามีตัวแปรจำนวนมากในข้อมูลต้นฉบับ แต่มีเพียงไม่กี่ตัวแปรที่ใช้งานได้จริง และ การสกัดลักษณะเฉพาะจะพิจารณาฟังก์ชันของตัวแปรทั้งหมดที่เป็นไปได้ วิธีการที่พบได้บ่อย ได้แก่:
- การวิเคราะห์องค์ประกอบหลัก (PCA)
- การวิเคราะห์ปัจจัย
- วิธีการเคอร์เนล
- วิธีการที่อาศัยระยะทางเช่น:
ดูเพิ่มเติม[แก้]
อ้างอิง[แก้]
- ↑ Roweis, S. T.; Saul, L. K. (2000). "Nonlinear Dimensionality Reduction by Locally Linear Embedding". Science. 290 (5500): 2323–2326. doi:10.1126/science.290.5500.2323. PMID 11125150.