ข้ามไปเนื้อหา

ปัญหาความชันอันตรธาน

จากวิกิพีเดีย สารานุกรมเสรี

ปัญหาความชันอันตรธาน (vanishing gradient problem) คือปัญหาที่พบในการเรียนรู้ของเครื่องเมื่อทำการฝึกโครงข่ายประสาทเทียมโดยใช้ การเคลื่อนลงตามความชัน และ การแพร่กระจายย้อนกลับ นี่เป็นปัญหาที่ค่าความชันที่ต้องการมีขนาดเล็กมากจนทำให้การเรียนรู้ไม่คืบหน้า[1]

สำหรับในกรณีของโครงข่ายประสาทแบบเวียนซ้ำ ได้มีการนำโครงสร้างที่เรียกว่าหน่วยความจำระยะสั้นแบบยาว (LSTM) มาใช้เพื่อแก้ปัญหานี้ ในขณะที่โครงสร้างที่เรียกว่า ResNet ได้ถูกนำมาใช้ในโครงข่ายการเรียนรู้เชิงลึก

นอกจากนี้แล้ว ในทางกลับกันบางครั้งความชันของฟังก์ชันกระตุ้นก็อาจได้ค่ามากและทำให้เกิดการแจกแจงออกเกินไป ปัญหาดังกล่าวเรียกว่า ปัญหาความชันระเบิด (exploding gradient problem)

อ้างอิง

[แก้]
  1. Okatani, Takayuki (2015). "On Deep Learning". Journal of the Robotics Society of Japan. 33 (2): 92–96. doi:10.7210/jrsj.33.92. ISSN 0289-1824.