ข้อมูลขนาดใหญ่

จากวิกิพีเดีย สารานุกรมเสรี
ภาพข้อมูลการแก้ไขวิกิพีเดีย สร้างโดยไอบีเอ็ม ข้อมูลหลายเทราไบต์ที่มีทั้งข้อความและรูปภาพของวิกิพีเดียเป็นตัวอย่างที่แพร่หลายของ big data

ในสาขาเทคโนโลยีสารสนเทศ, ข้อมูลขนาดใหญ่ (อังกฤษ: Big data) [1][2][3] คือชุมนุมของชุดข้อมูลที่มีขนาดและความซับซ้อนมาก จนมันยากที่จะประมวลผลได้ด้วยเครื่องมือจัดการฐานข้อมูลที่มีอยู่ ความท้าทายนี้รวมถึงการจับบันทึก การจัดเก็บ[4] การค้นหา การแบ่งปัน การวิเคราะห์[5] และการวาดภาพข้อมูล แนวโน้มของชุดข้อมูลต่างๆ ที่ใหญ่ขึ้นเป็นผลจากสารสนเทศเพิ่มเติมที่ได้มาจากการวิเคราะห์ชุดข้อมูลชุดใหญ่ชุดเดียวของข้อมูลที่เกี่ยวข้องกัน เทียบกับชุดข้อมูลย่อยๆ หลายชุดที่แยกจากกันที่มีขนาดรวมกันแล้วเท่ากัน สิ่งนี้อนุญาตให้ความเชื่อมโยงถูกค้นพบได้ เพื่อ "หาแนวโน้มทางธุรกิจ ตัดสินคุณภาพของงานวิจัย ป้องกันโรค วิเคราะห์การอ้างอิงกฎหมาย ต่อสู้กับอาชญากรรม และบอกสภาพการจราจรตามเวลาจริง"[6][7][8]

นิยาม[แก้]

big data มักรวมถึงชุดข้อมูลที่มีขนาดใหญ่เกินกว่าความสามารถของซอฟต์แวร์ที่ใช้กันอยู่ทั่วไป จะจับบันทึก จัดการ และประมวลผลข้อมูลดังกล่าวได้ภายในเวลาที่ยอมรับได้ ขนาดของ big data นั้นเป็นเป้าหมายที่เคลื่อนไปเรื่อยๆ ตามเวลา ในปี 2012 ขนาดของมันอยู่ที่ตั้งแต่ไม่กี่เทราไบต์ไปจนถึงหลายๆ เพตาไบต์ในชุดข้อมูลชุดเดียว ด้วยความยากลำบากนี้ แพลตฟอร์มใหม่สำหรับ "big data" จึงได้เกิดขึ้นเพื่อจะสามารถทำจัดการกับข้อมูลจำนวนมากเช่นนั้นได้ ตัวอย่างเช่น Apache Hadoop Big Data Platform.

ตัวอย่าง[แก้]

ตัวอย่างของ big data เช่น ปูมบันทึกการใช้งานเว็บ, RFID, เครือข่ายเซ็นเซอร์, เครือข่ายสังคม, ข้อมูลสังคม (social data), เอกสารและข้อความบนอินเทอร์เน็ต, การทำดัชนีค้นหาอินเทอร์เน็ต, บันทึกการโทรศัพท์, ดาราศาสตร์, วิทยาศาสตร์สภาพอากาศ, จีโนมิกส์, การวิจัยทางชีวธรณีเคมี ชีววิทยา และการวิจัยทางวิทยาศาสตร์ที่ซับซ้อนและมักจะข้ามสาขา, การสอดส่องทางการทหาร, เวชระเบียน, คลังภาพถ่าย, คลังภาพเคลื่อนไหว, และพาณิชย์อิเล็กทรอนิกส์ขนาดใหญ่

อ้างอิง[แก้]

  1. White, Tom (10 May 2012). Hadoop: The Definitive Guide. O'Reilly Media. p. 3. ISBN 978-1-4493-3877-0. 
  2. "MIKE2.0, Big Data Definition". 
  3. Grobelnik, Marko. "Big Data Tutorial". 
  4. Kusnetzky, Dan. "What is "Big Data?"". ZDNet. 
  5. Vance, Ashley (22 April 2010). "Start-Up Goes After Big Data With Hadoop Helper". New York Times Blog. 
  6. Cukier, K. (25 February 2010). "Data, data everywhere". The Economist. 
  7. "E-Discovery Special Report: The Rising Tide of Nonlinear Review". Hudson Global. สืบค้นเมื่อ 1 July 2012.  by Cat Casey and Alejandra Perez
  8. "What Technology-Assisted Electronic Discovery Teaches Us About The Role Of Humans In Technology — Re-Humanizing Technology-Assisted Review". Forbes. สืบค้นเมื่อ 1 July 2012. 

ดูเพิ่ม[แก้]

แหล่งข้อมูลอื่น[แก้]

อ้างอิง[แก้]