ความต่างที่สองตา

ความต่างที่สองตา (อังกฤษ: Binocular disparity) หมายถึงความแตกต่างของตำแหน่งวัตถุหนึ่ง ๆ ที่เห็นโดยตาซ้ายและตาขวาของมนุษย์ เพราะตาแยกห่างกันตามแนวนอน (ที่เรียกว่าพารัลแลกซ์) ในกระบวนการเห็นเป็น 3 มิติ สมองจะใช้ความต่างที่เห็นจากรูป 2 มิติซึ่งตกลงที่จอตาทั้งสองเพื่อดึงข้อมูลความใกล้ไกลของวัตถุ ในคอมพิวเตอร์วิทัศน์ Binocular disparity จะหมายถึงความต่างพิกัดของสิ่งที่เหมือนกันในภาพ 2 ภาพที่ถ่ายคู่กัน อุปกรณ์หาพิสัยโดยบรรจวบ (coincidence rangefinder) ก็ใช้เทคนิคคล้าย ๆ กันเพื่อกำหนดระยะทางและ/หรือความสูงของวัตถุเป้าหมาย ในดาราศาสตร์ ความต่างระหว่างตำแหน่งต่าง ๆ บนผิวโลกสามารถใช้กำหนดพารัลแลกซ์ของวัตถุท้องฟ้า และโคจรของโลกเองก็สามารถใช้กำหนดพารัลแลกซ์ดาว (stellar parallax)

นิยาม

ตาของมนุษย์ห่างกันตามแนวนอนประมาณ 50-75 มม (เป็นระยะระหว่างรูม่านตา) โดยต่างกันในแต่ละคน ๆ ดังนั้น ตาแต่ละข้างจึงมองเห็นโลกต่างกัน ปรากฏการณ์นี้สามารถเห็นได้ถ้าสลับปิดตาเมื่อจ้องดูวัตถุยาว ๆ ในแนวตั้ง (เช่น ปากกาดินสอ) วัตถุที่ว่าจะดูเหมือนย้ายที่เมื่อสลับตาดู

เมื่อกำลังมอง แนวมองของตาทั้งสองจะบรรจบกันที่จุด ๆ หนึ่งในปริภูมิข้างหน้า จุดในปริภูมินี้จะส่งภาพไปทอดตกลงที่ตำแหน่งเดียวกันของตาทั้งสองคือตรงกลางจอตา เนื่องจากมีส่วนในภาพซึ่งเห็นด้วยตาซ้ายขวาที่ไม่เหมือนกัน จึงมีจุดอื่น ๆ ในปริภูมิที่จะไม่ทอดตกลงที่จุดซึ่งคล้องจองกันบนจอตาทั้งสอง คำว่า visual binocular disparity จะนิยามว่าเป็นความต่างในระหว่างสองจอตาที่จุดจากภาพตกลง และปกติจะแสดงเป็นองศาที่เรียกว่า มุมสายตา (visual angle)^[1]

ส่วนคำว่า binocular disparity หมายถึงค่าทางเรขาคณิตที่วัดนอกตา เพราะความต่างของภาพซึ่งตกลงที่จอตาจะขึ้นอยู่กับปัจจัยต่าง ๆ ซึ่งเฉพาะต่อแต่ละตา ๆ โดยเฉพาะตำแหน่งของจุดบัพ (nodal point) ถ้าแม้ส่วนตัดขวางของจอตาจะเป็นวงกลมสมบูรณ์ ความต่างบนจอตาจะสอดล้องกับ binocular disparity ก็ต่อเมื่อวัดเป็นองศา แต่จะต่างกันมากถ้าวัดเป็นระยะทางเนื่องจากโครงสร้างที่ซับซ้อนภายในตา

ในรูปที่ 1 จุดดำตันเป็นจุดที่จ้องดู/ตรึงตา จุดสีน้ำเงินอยู่ใกล้คนดูกว่า ดังนั้น จึงมีความต่างแบบใกล้ คือ d_n ส่วนวัตถุที่อยู่ไกลกว่าสีเขียวก็มีความต่างแบบไกลคือ d_f ส่วนความต่างที่สองตาก็คือมุมระหว่างแนวฉายภาพที่ตกลงที่ตา คือ d_n-d_f โดยมีค่าบวกลบและวัดทวนเข็มนาฬิกา แนวหนึ่งเป็นแนวฉายภาพจริง ๆ จากวัตถุซึ่งตกลงที่จอตา ส่วนอีกแนวหนึ่งเป็นแนวฉายภาพจินตภาพที่วิ่งผ่านจุดบัพของจุดตรึงตา

ในคอมพิวเตอร์วิทัศน์ binocular disparity จะคำนวณจากภาพต่าง ๆ ที่ถ่ายด้วยกล้องเป็นคู่ ๆ ระยะห่างระหว่างกล้องเรียกว่า เส้นฐาน (baseline) ซึ่งจะมีผลต่อความต่างของจุดหนึ่ง ๆ ของภาพตามระนาบการถ่ายภาพของกล้อง เมื่อเส้นฐานเพิ่ม ความต่างก็จะเพิ่มขึ้นเนื่องจากมุมจะใหญ่ขึ้น แต่ในคอมพิวเตอร์วิทัศน์ binocular disparity จะอ้างอิงโดยความแตกต่างของจุดพิกัดระหว่างภาพซ้ายขวาแทนมุมสายตา ซึ่งปกติจะมีหน่วยเป็นพิกเซล

การลวงเซลล์ประสาทด้วยภาพ 2 มิติ

กลุ่มเซลล์ประสาท (นิวรอน) ในคอร์เทกซ์การเห็นปฐมภูมิซึ่งมีหน้าที่ประมวลข้อมูลจากจอตา จะสามารถตรวจจับความต่างของข้อมูลที่มาจากตาทั้งสอง คือ นิวรอนเช่นนี้จะทำงานถ้าวัตถุที่มีขนาดความต่างโดยเฉพาะ มาตกอยู่ภายในลานสายตาซึ่งนิวรอนมีลานรับสิ่งเร้า^[2]

นักวิจัยที่ตรวจสอบคุณสมบัติของนิวรอนเหล่านี้ได้แสดงสิ่งเร้าทางตาที่มีความต่าง (disparities) ต่าง ๆ กันต่อเซลล์เพื่อดูว่าเซลล์จะทำงานหรือไม่ วิธีหนึ่งในการแสดงสิ่งเร้าก็คือแสดงวัตถุที่ใกล้ไกลไม่เท่ากันต่อตา แต่ข้อเสียของวิธีนี้ก็คืออาจไม่แม่นยำพอสำหรับวัตถุที่อยู่ไกลออกไปเพราะมีความต่างเล็กมาก เทียบกับวัตถุที่อยู่ใกล้ ๆ ดังนั้น นักประสาทวิทยาศาสตร์จึงใช้วิธีอีกอย่างหนึ่งตามที่แสดงในรูป 2

ความต่างของวัตถุที่ใกล้ไกลต่าง ๆ กันนอกจุดตรึงตาสามารถทำให้เกิดโดยแสดงภาพหนึ่งแก่ตาข้างหนึ่ง แล้วแสดงภาพเดียวกันแต่เคลื่อนไปทางข้าง ๆ แก่ตาอีกข้างหนึ่ง ในรูป 2 วงกลมตันสีดำเป็นจุดตรึงตา วัตถุที่ "ใกล้ไกล" ต่าง ๆ กันก็จะวางที่จุดต่าง ๆ ตามเส้นตรึงตาของตาซ้าย ความต่างขนาดเดียวกันจากการวางวัตถุใกล้ไกลไม่เท่ากัน (วงกลมตันเป็นสี ๆ) ก็จะเกิดขึ้นโดยย้ายวัตถุไปทางด้านข้าง ๆ แต่ใกล้ไกลเท่ากัน (วงกลมดำมีขอบเป็นสี) ให้สังเกตว่า สำหรับความต่างแบบใกล้ การเคลื่อนไปทางด้านข้างจะต้องใหญ่กว่าเพื่อให้มีแนวตรงกัน ไม่เหมือนกับความต่างแบบไกล

การย้ายวัตถุทางด้านข้างโดยใช้สิ่งเร้าเป็นจุดสุ่ม (random dot stimuli) เช่นนี้มักใช้เพื่อศึกษาการตอบสนองต่อความต่างของนิวรอน เนื่องจากระยะที่ต้องเลื่อนสิ่งเร้าทางด้านข้าง จะน้อยกว่าที่ต้องเลื่อนตามความใกล้ไกลจริง ๆ หลักการนี้ก็ใช้ในภาพออโตสเตอริโอแกรมด้วย

การคำนวณความต่างโดยใช้ภาพดิจิตัลแบบคู่

ความต่างของลักษณะ/จุดต่าง ๆ ระหว่างภาพที่ถ่ายคู่ มักจะคำนวณโดยเลื่อนลักษณะต่าง ๆ ที่เห็นในภาพขวาไปทางซ้าย^[3] ยกตัวอย่างเช่น จุด ๆ หนึ่งที่ปรากฏที่พิกัดเอกซ์ t (วัดเป็นพิกเซล) ในรูปซ้าย อาจแสดงเป็นพิกัดเอกซ์ t - 3 สำหรับรูปขวา ในกรณีนี้ ความต่างสำหรับจุดนั้นในรูปขวาก็คือ 3 พิกเซล

แต่ภาพคู่เช่นนี้อาจไม่ตรงแนวเพื่อให้คำนวณความต่างได้ง่าย ๆ เสมอ ยกตัวอย่างเช่น กล้องอาจจะเงยหน้าก้มหน้าไม่ได้อยู่ในระนาบที่ถูกต้อง แต่ผ่านกระบวนการแปลงเชิงเส้นที่เรียกว่า การปรับภาพให้ตรง (image rectification) ภาพทั้งสองสามารถปรับหมุนเพื่อให้ต่างเพียงในแนวนอน (ตามแกนเอกซ์) โดยไม่ต่างกันในแนวตั้ง (คือแกนวาย)^[3] แต่นี่ก็เป็นคุณสมบัติที่สามารถทำโดยปรับกล้องคู่ให้ตรงแนวอย่างแม่นยำตั้งแต่ต้น

ขั้นตอนวิธีคอมพิวเตอร์

หลังจากปรับภาพให้ตรง การเปรียบส่วนที่เหมือนกันในรูปซ้ายขวา สามารถทำโดยใช้ขั้นตอนวิธีกราดตรวจภาพทั้งสองจากซ้ายไปขวาเพื่อหาส่วนที่เหมือนกัน วิธีสามัญที่ใช้แก้ปัญหานี้อย่างนึ่งก็คือการสร้าง "แผ่นปะ" (image patch) รอบ ๆ ทุก ๆ พิกเซลในภาพซ้าย แผ่นปะนี้จะใช้เทียบกับแผ่นปะที่คล้องจองกันกับภาพขวาเพื่อหาส่วนเหมือน

ยกตัวย่างเช่น สำหรับค่าความต่างที่ 1 แผ่นปะภาพซ้ายจะคล้ายกับแผ่นปะภาพขวาโดยเลื่อนไปทางซ้าย 1 พิกเซล การเปรียบเทียบแผ่นปะคู่เช่นนี้ สามารถทำได้โดยใช้สูตรคำนวณที่เปรียบพิกเซลแต่ละพิกเซลในแผ่นปะ เป็นสูตร 3 อย่างดังจะกล่าวต่อไป ในสูตรเหล่านี้ L และ R หมายถึงสดมภ์ (คอลัมน์) ซ้ายและขวา ในขณะที่ r (row) และ c (column) หมายถึงเลขแถวและสดมภ์ที่กำลังคำนวณในภาพหนึ่ง ๆ และ d หมายถึงความต่างของภาพขวา

Normalized correlation (สหสัมพันธ์แจกจงปกติ) : ${\frac {\sum {\sum {L(r,c)\cdot R(r,c-d)}}}{\sqrt {(\sum {\sum {L(r,c)^{2}}})\cdot (\sum {\sum {R(r,c-d)^{2}}})}}}$
Sum of squared differences (ผลบวกของค่าต่างยกกำลังสอง) : $\sum {\sum {(L(r,c)-R(r,c-d))^{2}}}$
Sum of absolute differences (ผลบวกของค่าต่างสัมบูรณ์) : $\sum {\sum {\left|L(r,c)-R(r,c-d)\right\vert }}$

ค่าความต่างต่ำสุดที่คำนวณโดยใช้วิธีใดวิธีหนึ่งจากสูตรเหล่านี้ ถือว่าเป็นความต่างของสิ่ง/ลักษณะที่กำลังคำนวณในภาพ เพราะค่าต่ำสุดบ่งชี้ว่า ขั้นตอนวิธีได้พบการจับคู่ลักษณะในภาพทั้งสองซึ่งดีที่สุด

วิธีที่กล่าวด้านบนเป็นขั้นตอนวิธีแบบการหาเทียบทุกตัว ดังนั้น ถ้าแผ่นปะหรือภาพใหญ่ เทคนิคนี้จะใช้เวลามาก เพราะพิกเซลแต่ละพิกเซล์จะต้องคำนวณแล้วคำนวณอีกเพื่อหาค่าสหสัมพันธ์ที่ต่ำสุด นอกจากนั้น พิกเซลยังซ้อนเหลื่อมกันทำให้ต้องคำนวณซ้ำ ๆ อย่างไม่จำเป็น ขั้นตอนวิธีที่มีประสิทธิภาพกว่า จะจำค่าต่าง ๆ จากพิกเซลที่คำนวณแล้ว และขั้นตอนวิธีที่มีประสิทธิภาพยิ่งกว่านั้น จะจำค่ารวมสดมภ์สำหรับแถวที่ผ่านมาแล้วนอกเหนือจากจำค่าต่าง ๆ ของพิกเซลที่คำนวณแล้ว ดังนั้น เทคนิคที่จำข้อมูลก่อน ๆ สามารถเพิ่มประสิทธิภาพของขั้นตอนวิธีเพื่อวิเคราะห์ภาพเช่นนี้

การใช้ความต่างจากรูป

ข้อมูลความต่างสามารถใช้ดึงข้อมูลอื่น ๆ จากรูปถ่ายคู่ กรณีหนึ่งที่มีประโยชน์ที่สุดก็คือการคำนวณความใกล้ไกล ความต่างและความใกล้ไกลจากกล้องจะสัมพันธ์กันอย่างผกผัน คือเมื่อระยะจากกล้องไกลขึ้น ความต่างของสองภาพก็จะลดลง ซึ่งทำให้สามารถคำนวณความใกล้ไกลโดยใช้ภาพถ่ายคู่ ดังนั้น จุดต่าง ๆ ที่อยู่บนภาพคู่ที่เป็น 2 มิติ จะสามารถคำนวณเป็นพิกัดต่าง ๆ ใน 3 มิติโดยใช้หลักเรขาคณิตและพีชคณิต

แนวคิดนี้มีประโยชน์เป็นพิเศษในการเดินหน ยกตัวอย่างเช่น ยานสำรวจดาวอังคาร Mars Exploration Rover ใช้วิธีคล้าย ๆ กันเพื่อกราดตรวจอุปสรรคในภูมิประเทศ^[4] คือ ยานจะจับภาพคู่ด้วยกล้องเดินหน แล้วคำนวณความต่างเพื่อตรวจจับวัตถุที่ยื่นสูงขึ้นมา เช่น ก้อนหิน^[5] นอกจากนั้นแล้ว ตำแหน่งและความเร็วของยาน สามารถดึงจากภาพคู่ที่ถ่ายต่อ ๆ กันโดยวัดระยะห่างของวัตถุเทียบกับยานสำรวจ ในบางกรณี นี่อาจจะเป็นข้อมูลที่แม่นยำที่สุด เพราะตัววัดความเร็วที่ล้ออาจจะไม่แม่นเนื่องจากการลื่นไถลของล้อ

ดูเพิ่ม

เชิงอรรถและอ้างอิง

↑ Qian, N (1997). "Binocular Disparity and the Perception of Depth". Neuron. 18: 359–368.{{cite journal}}: CS1 maint: uses authors parameter (ลิงก์)
↑ Gonzalez, F; Perez, R (1998). "Neural mechanisms underlying stereoscopic vision". Prog Neurobiol. 55 (3): 191–224.{{cite journal}}: CS1 maint: uses authors parameter (ลิงก์)
↑ ^3.0 ^3.1 Shapiro, Linda G; Stockman, George C (2001). Computer Vision. Prentice Hall. pp. 371–409.{{cite book}}: CS1 maint: uses authors parameter (ลิงก์)
↑ "The Computer Vision Laboratory". JPL.NASA.GOV. JPL/NASA. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2014-09-10. สืบค้นเมื่อ 2011-06-05.
↑ "Spacecraft: Surface Operations: Rover". JPL.NASA.GOV. JPL/NASA. สืบค้นเมื่อ 2011-06-05.^{[ลิงก์เสีย]}

[1] Qian, N (1997). "Binocular Disparity and the Perception of Depth". Neuron. 18: 359–368.{{cite journal}}: CS1 maint: uses authors parameter (ลิงก์)

[neural-2] Gonzalez, F; Perez, R (1998). "Neural mechanisms underlying stereoscopic vision". Prog Neurobiol. 55 (3): 191–224.{{cite journal}}: CS1 maint: uses authors parameter (ลิงก์)

[comp_vision-3] 3.0 ^3.1 Shapiro, Linda G; Stockman, George C (2001). Computer Vision. Prentice Hall. pp. 371–409.{{cite book}}: CS1 maint: uses authors parameter (ลิงก์)

[4] "The Computer Vision Laboratory". JPL.NASA.GOV. JPL/NASA. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2014-09-10. สืบค้นเมื่อ 2011-06-05.

[5] "Spacecraft: Surface Operations: Rover". JPL.NASA.GOV. JPL/NASA. สืบค้นเมื่อ 2011-06-05.^{[ลิงก์เสีย]}

[1]

[2]

[3]

[4]

[5]