อิมเมจเน็ต

โครงการอิมเมจเน็ต (อังกฤษ: ImageNet, แปลว่า เครือข่ายภาพ) เป็นชุดข้อมูลวิทัศน์ขนาดใหญ่ที่ออกแบบเพื่อใช้ในการค้นคว้าวิจัยซอฟต์แวร์จำแนกวัตถุวิทัศน์ (visual object recognition) มีภาพมากกว่า 14 ล้านภาพ^[1]^[2] ที่ได้รับการติดป้ายด้วยมือ (hand-annotated) ในโครงการ เพื่อระบุว่าวัตถุในภาพคืออะไร และในจำนวนนี้มีอย่างน้อยหนึ่งล้านภาพที่มีการตีกรอบขอบเขตของวัตถุด้วย^[3] อิมเมจเน็ตประกอบด้วยมากกว่า 20,000 หมวดหมู่^[2] โดยเป็นหมวดหมู่สิ่งของทั่วไปเช่น "ลูกโป่ง" หรือ "สตรอว์เบอร์รี" ซึ่งแต่ละหมวดหมู่มีภาพอยู่หลายร้อยภาพ^[4] ชุดข้อมูลของการระบุวัตถุบนภาพจากยูอาร์แอลภาพจากแหล่งตติยภูมินั้นสามารถเข้าถึงได้โดยเสรีผ่านอิมเมจเน็ต กระนั้นภาพเหล่านั้นอิมเมจเน็ตไม่ได้เป็นเจ้าของ^[5] นับตั้งแต่ปี 2010 โครงการอิมเมจเน็ตได้จัดการแข่งขันซอฟต์แวร์ในชื่อ การแข่งขันการจำแนกวิทัศน์ขนานใหญ่อิมเมจเน็ต (ImageNet Large Scale Visual Recognition Challenge) หรือ ILSVRC ที่ซึ่งโปรแกรมซอฟต์แวร์แข่งขันกันในการคัดแยกวัตถุและฉากภาพ^[6]

ชุดข้อมูล

อิมเจเน็ตใช้การคราวด์ซอร์ซในขั้นตอนการติดป้ายภาพ (annotation) การติดป้ายในระดับภาพ (image-level annotation) ระบุการมีอยู่หรือไม่มีอยู่ของชั้นวัตถุในภาพหนึ่ง ๆ เช่น "มีหมีอยู่ในภาพนี้" หรือ "ไม่มีหมีอยู่ในภาพนี้" การติดป้ายระดับวัตถุ (Object-level annotation) จะวาดขอบเขตของวัตถุที่ระบุนั้น ๆ ในภาพ อิมเมจเน็ตใช้ตัวแปลของชุดเวิร์ดเน็ตที่กว้างใหญ่เพื่อจัดหมวดหมู่วัตถุ มีการเพิ่มเติม 120 หมวดหมู่ของสายพันธุ์สุนัขเพื่อแสดงการจัดจำแนกในขชชั้นละเอียด (fine-grained classification)^[6] ในปี 2012 อิมเมจเน็ตเคยเป็นผู้ใช้เชิงการศึกษาที่ใหญ่ที่สุดของเม็กคันนิคอลเทิร์ก (Mechanical Turk) โดยคนงานระบุภาพเฉลี่ย 50 ภาพต่อนาที^[2]

อ้างอิง

↑ "New computer vision challenge wants to teach robots to see in 3D". New Scientist. 7 April 2017. สืบค้นเมื่อ 3 February 2018.
↑ ^2.0 ^2.1 ^2.2 Markoff, John (19 November 2012). "For Web Images, Creating New Technology to Seek and Find". The New York Times. สืบค้นเมื่อ 3 February 2018.
↑ "ImageNet". 2020-09-07. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2020-09-07. สืบค้นเมื่อ 2022-10-11.
↑ "From not working to neural networking". The Economist. 25 June 2016. สืบค้นเมื่อ 3 February 2018.
↑ "ImageNet Overview". ImageNet. สืบค้นเมื่อ 15 October 2022.
↑ ^6.0 ^6.1 Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.

[New_Scientist-1] "New computer vision challenge wants to teach robots to see in 3D". New Scientist. 7 April 2017. สืบค้นเมื่อ 3 February 2018.

[nytimes_2012-2] 2.0 ^2.1 ^2.2 Markoff, John (19 November 2012). "For Web Images, Creating New Technology to Seek and Find". The New York Times. สืบค้นเมื่อ 3 February 2018.

[3] "ImageNet". 2020-09-07. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2020-09-07. สืบค้นเมื่อ 2022-10-11.

[economist-4] "From not working to neural networking". The Economist. 25 June 2016. สืบค้นเมื่อ 3 February 2018.

[5] "ImageNet Overview". ImageNet. สืบค้นเมื่อ 15 October 2022.

[ILJVRC-2015-6] 6.0 ^6.1 Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.

[1]

[2]

[3]

[4]

[5]

[6]