การลดมิติ

ส่วนหนึ่งของเนื้อหา |
การเรียนรู้ของเครื่อง และ การทำเหมืองข้อมูล |
---|
![]() |
การลดมิติ (dimensionality reduction) ในสาขาการเรียนรู้ของเครื่องและสถิติศาสตร์ หมายถึงกระบวนการลดจำนวนของตัวแปรสุ่ม และได้ชุดของตัวแปรหลักที่ไม่มีความสัมพันธ์กัน ภายใต้เงื่อนไขที่จำกัดบางประการ[1] การลดมิติสามารถแบ่งย่อยได้เป็นสองวิธีใหญ่ ๆ คือ การคัดเลือกตัวแปร และ การสกัดค่าแทนลักษณะ
การคัดเลือกตัวแปร
[แก้]ในการคัดเลือกตัวแปร จะเริ่มจากพิจารณาว่าข้อมูลมีตัวแปรซ้ำซ้อนหรือไม่เกี่ยวข้องจำนวนมาก (หรือสมบัติ ลักษณะ ตัวบ่งชี้ ฯลฯ) และจุดมุ่งหมายคือการค้นหาตัวแปรหลักจากชุดตัวแปรดั้งเดิม เอกสารงานวิจัยส่วนใหญ่เกี่ยวกับการเลือกตัวแปรในสถิติสมัยใหม่มุ่งเน้นไปที่สถิติมิติสูง (High-dimensional statistics) ในจำนวนนั้น วิธีการที่พบได้บ่อย ได้แก่:
การสกัดค่าแทนลักษณะ
[แก้]การสกัดค่าแทนลักษณะ ถือได้ว่าเป็นวิธีการทั่วไปในการเลือกตัวแปร: การเลือกตัวแปร ถือว่ามีตัวแปรจำนวนมากในข้อมูลต้นฉบับ แต่มีเพียงไม่กี่ตัวแปรที่ใช้งานได้จริง และ การสกัดค่าแทนลักษณะจะพิจารณาฟังก์ชันของตัวแปรทั้งหมดที่เป็นไปได้ วิธีการที่พบได้บ่อย ได้แก่:
- การวิเคราะห์องค์ประกอบหลัก (PCA)
- การวิเคราะห์ปัจจัย
- วิธีการเคอร์เนล
- วิธีการที่อาศัยระยะทางเช่น:
ดูเพิ่มเติม
[แก้]อ้างอิง
[แก้]- ↑ Roweis, S. T.; Saul, L. K. (2000). "Nonlinear Dimensionality Reduction by Locally Linear Embedding". Science. 290 (5500): 2323–2326. doi:10.1126/science.290.5500.2323. PMID 11125150.