ข้ามไปเนื้อหา

การลดมิติ

จากวิกิพีเดีย สารานุกรมเสรี
ข้อมูลตัวเลข 0-9 ของ MNIST ทำการลดเหลือ 2 มิติเพื่อแสดงภาพโดยใช้การวิเคราะห์องค์ประกอบหลัก (ภาพซ้าย) และตัวเข้ารหัสอัตโนมัติเชิงเส้น (ภาพขวา)

การลดมิติ (dimensionality reduction) ในสาขาการเรียนรู้ของเครื่องและสถิติศาสตร์ หมายถึงกระบวนการลดจำนวนของตัวแปรสุ่ม และได้ชุดของตัวแปรหลักที่ไม่มีความสัมพันธ์กัน ภายใต้เงื่อนไขที่จำกัดบางประการ[1] การลดมิติสามารถแบ่งย่อยได้เป็นสองวิธีใหญ่ ๆ คือ การคัดเลือกตัวแปร และ การสกัดค่าแทนลักษณะ

การคัดเลือกตัวแปร

[แก้]

ในการคัดเลือกตัวแปร จะเริ่มจากพิจารณาว่าข้อมูลมีตัวแปรซ้ำซ้อนหรือไม่เกี่ยวข้องจำนวนมาก (หรือสมบัติ ลักษณะ ตัวบ่งชี้ ฯลฯ) และจุดมุ่งหมายคือการค้นหาตัวแปรหลักจากชุดตัวแปรดั้งเดิม เอกสารงานวิจัยส่วนใหญ่เกี่ยวกับการเลือกตัวแปรในสถิติสมัยใหม่มุ่งเน้นไปที่สถิติมิติสูง (High-dimensional statistics) ในจำนวนนั้น วิธีการที่พบได้บ่อย ได้แก่:

การสกัดค่าแทนลักษณะ

[แก้]

การสกัดค่าแทนลักษณะ ถือได้ว่าเป็นวิธีการทั่วไปในการเลือกตัวแปร: การเลือกตัวแปร ถือว่ามีตัวแปรจำนวนมากในข้อมูลต้นฉบับ แต่มีเพียงไม่กี่ตัวแปรที่ใช้งานได้จริง และ การสกัดค่าแทนลักษณะจะพิจารณาฟังก์ชันของตัวแปรทั้งหมดที่เป็นไปได้ วิธีการที่พบได้บ่อย ได้แก่:

ดูเพิ่มเติม

[แก้]

อ้างอิง

[แก้]
  1. Roweis, S. T.; Saul, L. K. (2000). "Nonlinear Dimensionality Reduction by Locally Linear Embedding". Science. 290 (5500): 2323–2326. doi:10.1126/science.290.5500.2323. PMID 11125150.