การลดมิติ

การลดมิติ (Dimensionality reduction) ในสาขาการเรียนรู้ของเครื่องและสถิติศาสตร์ หมายถึงกระบวนการลดจำนวนของตัวแปรสุ่ม และได้ชุดของตัวแปรหลักที่ไม่มีความสัมพันธ์กัน ภายใต้เงื่อนไขที่จำกัดบางประการ^[1] การลดมิติสามารถแบ่งย่อยได้เป็นสองวิธีใหญ่ ๆ คือ การคัดเลือกตัวแปร และ การสกัดลักษณะเฉพาะ

การคัดเลือกตัวแปร

ในการคัดเลือกตัวแปร จะเริ่มจากพิจารณาว่าข้อมูลมีตัวแปรซ้ำซ้อนหรือไม่เกี่ยวข้องจำนวนมาก (หรือคุณสมบัติ คุณลักษณะ ตัวบ่งชี้ ฯลฯ) และจุดมุ่งหมายคือการค้นหาตัวแปรหลักจากชุดตัวแปรดั้งเดิม เอกสารงานวิจัยส่วนใหญ่เกี่ยวกับการเลือกตัวแปรในสถิติสมัยใหม่มุ่งเน้นไปที่สถิติมิติสูง (High-dimensional statistics) ในจำนวนนั้น วิธีการที่พบได้บ่อย ได้แก่:

การสกัดลักษณะเฉพาะ

การสกัดลักษณะเฉพาะ ถือได้ว่าเป็นวิธีการทั่วไปในการเลือกตัวแปร: การเลือกตัวแปร ถือว่ามีตัวแปรจำนวนมากในข้อมูลต้นฉบับ แต่มีเพียงไม่กี่ตัวแปรที่ใช้งานได้จริง และ การสกัดลักษณะเฉพาะจะพิจารณาฟังก์ชันของตัวแปรทั้งหมดที่เป็นไปได้ วิธีการที่พบได้บ่อย ได้แก่:

ดูเพิ่มเติม

อ้างอิง

↑ Roweis, S. T.; Saul, L. K. (2000). "Nonlinear Dimensionality Reduction by Locally Linear Embedding". Science. 290 (5500): 2323–2326. doi:10.1126/science.290.5500.2323. PMID 11125150.

[1] Roweis, S. T.; Saul, L. K. (2000). "Nonlinear Dimensionality Reduction by Locally Linear Embedding". Science. 290 (5500): 2323–2326. doi:10.1126/science.290.5500.2323. PMID 11125150.

[1]