ข้ามไปเนื้อหา

อิมเมจเน็ต

จากวิกิพีเดีย สารานุกรมเสรี

โครงการอิมเมจเน็ต (อังกฤษ: ImageNet, แปลว่า เครือข่ายภาพ) เป็นชุดข้อมูลวิทัศน์ขนาดใหญ่ที่ออกแบบเพื่อใช้ในการค้นคว้าวิจัยซอฟต์แวร์จำแนกวัตถุวิทัศน์ (visual object recognition) มีภาพมากกว่า 14 ล้านภาพ[1][2] ที่ได้รับการติดป้ายด้วยมือ (hand-annotated) ในโครงการ เพื่อระบุว่าวัตถุในภาพคืออะไร และในจำนวนนี้มีอย่างน้อยหนึ่งล้านภาพที่มีการตีกรอบขอบเขตของวัตถุด้วย[3] อิมเมจเน็ตประกอบด้วยมากกว่า 20,000 หมวดหมู่[2] โดยเป็นหมวดหมู่สิ่งของทั่วไปเช่น "ลูกโป่ง" หรือ "สตรอว์เบอร์รี" ซึ่งแต่ละหมวดหมู่มีภาพอยู่หลายร้อยภาพ[4] ชุดข้อมูลของการระบุวัตถุบนภาพจากยูอาร์แอลภาพจากแหล่งตติยภูมินั้นสามารถเข้าถึงได้โดยเสรีผ่านอิมเมจเน็ต กระนั้นภาพเหล่านั้นอิมเมจเน็ตไม่ได้เป็นเจ้าของ[5] นับตั้งแต่ปี 2010 โครงการอิมเมจเน็ตได้จัดการแข่งขันซอฟต์แวร์ในชื่อ การแข่งขันการจำแนกวิทัศน์ขนานใหญ่อิมเมจเน็ต (ImageNet Large Scale Visual Recognition Challenge) หรือ ILSVRC ที่ซึ่งโปรแกรมซอฟต์แวร์แข่งขันกันในการคัดแยกวัตถุและฉากภาพ[6]

ชุดข้อมูล

[แก้]

อิมเจเน็ตใช้การคราวด์ซอร์ซในขั้นตอนการติดป้ายภาพ (annotation) การติดป้ายในระดับภาพ (image-level annotation) ระบุการมีอยู่หรือไม่มีอยู่ของชั้นวัตถุในภาพหนึ่ง ๆ เช่น "มีหมีอยู่ในภาพนี้" หรือ "ไม่มีหมีอยู่ในภาพนี้" การติดป้ายระดับวัตถุ (Object-level annotation) จะวาดขอบเขตของวัตถุที่ระบุนั้น ๆ ในภาพ อิมเมจเน็ตใช้ตัวแปลของชุดเวิร์ดเน็ตที่กว้างใหญ่เพื่อจัดหมวดหมู่วัตถุ มีการเพิ่มเติม 120 หมวดหมู่ของสายพันธุ์สุนัขเพื่อแสดงการจัดจำแนกในขชชั้นละเอียด (fine-grained classification)[6] ในปี 2012 อิมเมจเน็ตเคยเป็นผู้ใช้เชิงการศึกษาที่ใหญ่ที่สุดของเม็กคันนิคอลเทิร์ก (Mechanical Turk) โดยคนงานระบุภาพเฉลี่ย 50 ภาพต่อนาที[2]

อ้างอิง

[แก้]
  1. "New computer vision challenge wants to teach robots to see in 3D". New Scientist. 7 April 2017. สืบค้นเมื่อ 3 February 2018.
  2. 2.0 2.1 2.2 Markoff, John (19 November 2012). "For Web Images, Creating New Technology to Seek and Find". The New York Times. สืบค้นเมื่อ 3 February 2018.
  3. "ImageNet". 2020-09-07. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2020-09-07. สืบค้นเมื่อ 2022-10-11.
  4. "From not working to neural networking". The Economist. 25 June 2016. สืบค้นเมื่อ 3 February 2018.
  5. "ImageNet Overview". ImageNet. สืบค้นเมื่อ 15 October 2022.
  6. 6.0 6.1 Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.