ทฤษฎีข้อมูล

จากวิกิพีเดีย สารานุกรมเสรี

ทฤษฏีข้อมูล (อังกฤษ: Data Theory) เป็นทฤษฏีที่ว่าด้วยการแทนเชิงนามธรรมของแง่มุมต่าง ๆ ของข้อมูล ซึ่งใช้แบ่งแยกสถานะการณ์ต่าง ๆ ของข้อมูลที่เป็นไปได้ออกด้วยแนวคิดจำนวนน้อย

แง่มุมหลัก ๆ สองแง่มุมของทฤษฎีข้อมูลคือ

  • ทฤษฏีการออกแบบเชิงประจักษ์ หรือ เชิงประสบการณ์ (Empirical Design Theory)
  • ทฤษฏีการวัดผล (Measurement Theory)

ทฤษฎีการออกแบบเชิงการทดลอง[แก้]

เป้นแง่มุมของทฤษฎีที่ว่าด้วยหัวข้อต่าง ๆ เช่น

  • เงื่อนไขการทดลอง คือแง่มุมต่าง ๆของสถานการณ์ในการทดลอง
  • วิถี หมายถึงการออกแบบการทดลองปกติ ได้แก่จำนวนเงื่อนไขใดบ้างในการทดลองที่ต้องคำนึงถึง การออกแบบการทดลองยังรวมถึงเงื่อนไขหลาย ๆ อย่างที่ต้องคำนึงถึงพร้อม ๆ กัน
    • ระดับการทดลอง คือจำนวนค่าที่ต่างกันของวิถึการออกแบบ
    • การซ้ำการทดลอง คือวิธีพิเศษในการออกแบบที่ใช้โดยการทำซ้ำเดิมวิถีทางโดยการผสมการออกแบบการทดลองต่าง ๆ เข้าด้วยกัน
  • ภาวะการทดลอง คือจำนวนวิถึของการออกแบบที่มีเอกลักษณ์ ซึ่งพิจารณาด้วยข้อมูลที่เกี่ยวข้องคือ
    • รูปร่าง เช่น ข้อมูลอาจจะเป็นสี่เหลี่ยมด้านเท่า (สองทาง,หนึ่งภาวะ)หรือเป็นสี่เหลี่ยมด้านขนาน (สองทาง, สองภาวะ)
    • สมมาตรหรือไม่สมมาตร ข้อมูลที่เป็นสี่เหลี่ยมอาจจะสมมาตรหรืไม่ก็ได้ โดยข้อมูลที่ไม่สมมาตรจะเรียกว่าข้อมูลสามเหลี่ยม
    • ข้อมูลแจกแจงหลายตัวแปร ข้อมูลเหล่านี้จะเป็นสี่เหลี่ยมด้านขนาน ส่วนใหญ่มีหนึ่งภาวะ และข้อมูลมักจะอยู่เรียงตัวเป็นสดมภ์
  • ความสมบูรณ์ หากไม่มีข้อมูลหาข้อมูลจะเรียกว่าข้อมูลที่สมบูรณ์
  • หมวดหมู่ในการสำรวจ
    • การสำรวจจะต้องจัดหมวดหมู่
    • สามารถใช้ตัวแปรเสริมของข้อมูล
  • หมวดหมู่ต้องชัดเจนและมีจำนวนน้อย

ทฤษฎีในการวัดผล[แก้]

เป็นแง่มุมเกี่ยวกับการกำหนดค่าตัวเลขให้กับลักษณะเฉพาะของสิ่งที่สำรวจหรือเหตุการณ์ต่าง ๆ โดยกำหนดกฎเกณฑ์ที่ใช้ให้เข้าใจง่าย ใช้งานง่ายและได้ค่าตัวเลขที่เกี่ยวข้องกับชุดของการวัดผลอื่น ๆ เท่าที่เป็นไปได้

ตัวอย่างเกี่ยวกับการใช้ทฤษฎีข้อมูล[แก้]

ตัวอย่างเช่นการวิเคราะห์ความแตกต่างภายในหรือระหว่างกลุ่ม หรือ ความแปรปรวนตามหัวข้อของข้อมูลที่มีการแจกแจงหลายตัวแปร (multivariate data) วิธีการเชิงสถิติดั้งเดิมในการวิเคราะห์แบบมีการแจกแจงหลายตัวแปรนั้นจะสมมติว่าหน่วยในการวิเคราะห์นั้นที่แยกเฉพาะกลุ่ม (เช่น บุคคล, เด็ก, ผู้ใหญ่ ฯลฯ)นั้นจัดอยู่ในกลุ่มประชากรแบบเอกพันธุ์ (homogeneous population)และสามารถจัดเป็นกลุ่มตัวอย่างสุ่มจากประชากรกลุ่มนี้

อย่างไรก็ตามในทางการศึกษาด้านพฤติกรรม การสำรวจมักไม่เป็นไปอย่างไม่อิสระ และกลุ่มประชากรก็ไม่เอกพันธุ์คือ มีความหลากหลาย ซึ่งบ่อยครั้งไม่สามารถระบุได้ ซึ่งในสถานะการณ์แบบนี้จำเป็นต้องใช้วิธีการเชิงทฤษฏีข้อมูลในการพัฒนาวิธีที่ไม่ขึ้นกับการปรับค่าปรกติที่มีการแจกแจงหลายตัวและตัวอย่างแบบเอกพันธุ์ และเนื่องจากว่าการสำรวจแบ่งแยกเป็นกลุ่มย่อย ความแตกต่างภายในกลุ่มและนอกกลุ่มก็จะมีค่าตรงกลางซึ่งเรียกว่าการศึกษาปฏิสัมพันธ์ระหว่างกลุ่ม

การศึกษาทฤษฏีข้อมูลมุ่งเน้นไปใช้งานเกี่ยวกับความสัมพันธ์การศึกษาเชิงพฤติกรรมเช่นเรื่อง ศึกษาศาสตร์ และจิตวิทยา หรือเน้นในการค้นพบช่วงทั้งหมดของข้อมูลการสำรวจ และทดลองทางการแพทย์ ชีววิทยา และวิทยาศาสตร์สิ่งมีชีวิต

ดูเพิ่ม[แก้]