คุยกับผู้ใช้:SiwakornCP36

ไม่รองรับเนื้อหาของหน้าในภาษาอื่น
จากวิกิพีเดีย สารานุกรมเสรี

การค้นหาค่าเหมาะสุดอย่างตอบสนอง (อังกฤษ: reactive search optimization)

การค้นหาค่าเหมาะสุดอย่างตอบสนอง เป็นหนึ่งในขึ้นตอนวิธีการหาค่าเหมาะสุดที่อยู่บนพื้นฐานของเทคนิดการค้นหา มันเป็นรูปแบบหนึ่งของการศึกษาสำนึก(heuristics)ซึ่งปรับเปลี่ยนค่าในการทำงานในระหว่างขึ้นตอนการหาค่าเหมาะสุด

ลักษณะโดยทั่วไป: การเรียนรู้ในขณะค้นหาค่าเหมาะสุด[แก้]

ไฟล์:Reactive Search Optimization Learning Loop.png
RSO learning loop

การค้นหาค่าเหมาะสุดอย่างตอบสนองก็เหมือนวิธีการค้นหาทั่วๆไปที่ถูกนำมาใช้แก้ปัญหาจำพวกการหาโครงแบบที่เหมาะสมของระบบ โดยที่โครงแบบดังกล่าวมักจะประกอบด้วยตัวแปรที่เปลี่ยนแปลงไปมาทั้งในลักษณะที่ต่อเนื่องและไม่ต่อเนื่อง แต่ในขณะเดียวกันเกณฑ์ในการหาค่าเหมาะสุดนั้นเป็นเพียงตัวเลขตัวเดียว ส่วนใหญ่แล้วปัญหาการหาค่าเหมาะสุดนั้นมักจะถูกลดรูปไปสู่ปัญหาการหาค่าน้อยที่สุดของฟังก์ชันที่มีอากิวเมนต์ของฟังก์ขันนี้ก็คือตัวแปรโครงแบบที่ถูกมองว่าเป็นตัวแปรอิสระในโดเมนของฟังก์ชันนี้นั่นเอง

การค้นหาค่าเหมาะสุดอย่างตอบสนองนั้นสนับสนุนการผสมผสานกันระหว่างวิธีการการเรียนรู้ของเคร้ื่องภายใต้วิธีทางสัญลักษญ์(sub-symbolic machine learning)และการศึกษาสำนึกด้วยวิธีการค้นหา(search heuristics) เพื่อร่วมกันแก้ปัญหาการหาค่าเหมาะสุดที่ซับซ้อน คำว่า "อย่างตอบสนอง" นั้น หมายถึงพร้อมเสมอที่จะตอบสนองต่อเหตุการณ์ระหว่างการค้นหา ทั้งประวัติในการค้นหาและความรู้ต่างๆที่เก็บสะสมมาในขณะที่เคลื่อนตัวผ่านพื้นที่โครงแบบนั้นถูกใช้ในการปรับตัวเองอย่างอัตโนมัติ ซึ่งขั้นตอนวิธีการนี้ได้ถูกสร้างขึ้นมาเพื่อให้มีความยืนหยุ่นอย่างมากในการจัดการกับปัญหาที่แตกต่างในระหว่างการค้นหา หรือกล่าวโดยสรุปว่ามันมีความมสามารถในการปรับตัวอย่างอัตโนมัติโดยการตัดสินใจจากประสบการณ์ในอดีตนั่นเอง

Da Vinci's man, RSO inspiration

ในโลกแห่งความเป็นจริงนั้น คนต้องพบเจอกับปัญหาในชีวิตประจำวันมากมาย เรามักเลือกตัดสินปัญหาหลายๆอย่างโดยยึดจากการสังเกตและเรียนรู้ประสบการณ์ที่ผ่านในอดีตของตนมาเป็นแนวทางในการแก้ไข และสมองของคนที่มีการเรียนรู้ที่รวดเร็วทำให้ในบางครั้งที่กำลังตัดสินใจทำอะไรไปแล้ว ก็อาจจะต้องเปลี่ยนแผนกลางครันเมื่อเห็นว่าเราเดินมาผิดทางและมีทางที่น่าจะได้ผลดีกว่าทางปัจจุบัน ด้วยพฤติกรรมของคนนี้เองเป็นแบบอย่างให้เกิดขึ้นตอนวิธีนี้ขึ้น เพราะในโลกของการแก้ปัญหาทางคอมพิวเตอร์นั้นก็มีวิธีการค้นหาคำตอบมากมายผ่านปริภูมิการค้นหา(search space)เช่นเดียวกัน ทำให้เกิดการเพิ่มวิธีการเรียนรู้ของเครื่อง(machine learning)ไปสู่การค้นหาค่าเหมาะสุดอย่างตอบสนอง

ปัญหาการปรับค่าตัวแปรในกระบวนการศึกษาสำนึก[แก้]

การศึกษาสำนึกในปัญหาการค้นหาส่วนใหญ่เช่น กาค้นหาด้วยวิธีการทาบู (tabu search) และการหลอมลวง (simulated annealing) ได้ถูกนำมาใช้ในโปรแกรมคอมพิวเตอร์อย่างมีประสิทธภาพและมีประโยชน์ โดยการศึกษาสำนึกเหล่านี้มีลักษณะที่อ่อนไหวต่อตัวแปรภายในเป็นอย่างมาก ตัวอย่างเช่นปัญหาการหลอมลวงซึ่งขึ้นอยู่การตารางเวลาการหลอมบ่อยครั้งถูกอธิบายโดยตัวแปรอัตราการทำให้เย็นตัวลง(cooling rate) โดยค่าที่เหมาะที่สุดมีควาแตกต่างไปตามแต่ละกรณีซึ่งกำลังถูกแก้ไป ดังนั้นขึ้นตอนวิธีเดียวกันจึงต้องการค่าการเปลี่ยนที่ดีและแน่นอนเพื่อที่สามารถนำมาใช้กับปัญหาใหม่ได้ ในขั้นตอนการหาค่าเหมาะสุดโดยทั่วไปผู้ออกแบบมักจะใส่การปรับเปลี่ยนเพียงเล็กน้อยในขึ้นตอนวิธีนั้นเพื่อเพิ่มความเร็วของระบบ

เป็นที่สังเกตว่าผลการวิจัยจำนวนมากที่เกี่ยวกับการศึกษาสำนึกการค้นหาค่าเหมาะสุดมีความลำเอียงมาจากปัญหานี้ เพราะในบางครั้งประสิทธิภาพของขั้นตอนวิธีถูกคำนวณหลังจากที่ได้เปลี่ยนตัวแปรแล้ว ทั้งที่จริงแล้วกำลังทั้งหมดของการหาค่าเหมาะสุดรวมถึงเวลาในการปรับค่าตัวแปรควรที่จะถูกรวมเข้ามาคิดด้วย

การปรับค่าตัวแปรในฐานะองค์ประกอบหลักของการศึกษาสำนึก[แก้]

การค้นหาค่าเหมาะสุดอย่างตอบสนองให้วิธีการแก้ปัญหาโดยการบวกกลไกการปรับค่าตัวแปรลงไปในขึ้นตอนวิธีการค้นหาด้วยตัวมันเอง ซึ่งตัวแปรเหล่านี้จะถูกปรับด้วยวงวนการป้อนข้อมูลอัตโนมัติตัวหนึ่งซึ่งจะปรับตัวไปตามคุณภาพของการวิธีแก้ปัญหาที่พบ จากประวัติการค้าหา และจากเกณฑ์อื่นๆ

ประโยชน์[แก้]

  • ความอัตโนมัติของวิธีการหาค่าเหมาะสุดรวมถึงความอัตโนมัติของขึ้นตอนการปรับค่าตัวแปรที่เหมาะสม
  • การปรับตัวพลวัตของตัวแปรการค้นหา ซึ่งอาจจะเกิดขึ้นในทุกๆก้าวของการค้นหา นำไปสู่เวลาในการหาค่าเหมาะสุดรวมที่เร็วขึ้น
  • รูปแบบที่เพิ่มขึ้นของผลลัพธ์เพราะขั้นตอนวิธีที่สมบูรณ์แบบของการปรับค่าตัวแปร

การค้นหาค่าเหมาะสุดอย่างตอบสนองและการค้นหาค่าเหมาะสุดอย่างชาญฉลาด[แก้]

RSO is multi-disciplinary

การค้นหาค่าเหมาะสุดอย่างตอบสนองจัดอยู่ในพื้นที่การวิจัยที่ซ้อนทับกันหลายองค์ประกอบ ทั้งการวิจัยทางการจัดการ(การหาค่าเหมาะสุด) วิทยาศาสตร์คอมพิวเตอร์ การเรียนรู้ของเครื่องจักร รวมถึงเครือข่ายระบบประสาท จุดประสงค์หลักคือเพื่อที่จะศึกษารูปแบบการเรียนรุ้ที่สามารถประยุกต์ใช้ไปในการแก้ไขปัญหาและการหาค่าเหมาะสุด

สัญญาณการเรียนรู้ที่มีผลต่อการปรับค่าตัวแปรภายในของวิธีการการแก้ปัญหาได้มาจากสามแหล่ง คือ

  1. ปัญหาการหาค่าเหมาะสุด ตัวอย่างเช่น ตัวแปรและตัวเลือกสำหรับการค้นหาที่ถูกประยุกต์ไปใช้กับปัญหา Travelling salesman problem(TSP) จะแตกต่างอย่างมากตัวแปรที่ใช้กับปัญหา Satisfiability
  2. กรณีที่เฉพาะเจาะจง ตัวอย่างเช่น การแก้ปัญหา TSP สำหรับเมืองในเทือกเขาแอลป์อาจจะต้องการตัวแปรการแก้ปัญหานี้สำหรับเมืองในพื้นราบ
  3. ลักษณะพิเศษในปริภูมิโครงแบบโดยรอบคำตอบที่ถูกเลือก ตัวอย่างเช่นถ้าคำตอบปัจจุบันถูกจำกัดอยู่ในอ่างน้ำรอบจุดเหมาะสุด

ดูเพิ่ม[แก้]

อ้างอิง[แก้]

  • Battiti, Roberto (2008). Reactive Search and Intelligent Optimization. Springer Verlag. ISBN 978-0-387-09623-0. {{cite book}}: ไม่รู้จักพารามิเตอร์ |coauthors= ถูกละเว้น แนะนำ (|author=) (help)
  • Battiti, Roberto (1994). "The reactive tabu search" (PDF). ORSA Journal on Computing. 6 (2): 126–140. {{cite journal}}: ไม่รู้จักพารามิเตอร์ |coauthors= ถูกละเว้น แนะนำ (|author=) (help)