การแจกแจงปรกติหลายตัวแปร

จากวิกิพีเดีย สารานุกรมเสรี
การแจกแจงแบบปรกติหลายตัวแปร
ฟังก์ชันความหนาแน่นของความน่าจะเป็น
Bivariate normal distribution

Bivariate normal distribution with μ = [5,2] and Σ1,1 = 2, Σ1,2 = Σ2,1 Σ2,2 = 0.8.
สัญกรณ์: \mathcal{N}(\mu,\,\Sigma)
ตัวแปรเสริม: μRklocation
Σ ∈ Rk×kcovariance (nonnegative-definite matrix)
ฟังก์ชันค้ำจุน: x ∈ span(Σ) ⊆ Rk
pdf: ((2\pi)^{\text{rank}(\Sigma)}\text{det}^*(\Sigma))^{-\frac{1}{2}}\, e^{ -\frac{1}{2}(x-\mu)'\Sigma^{-1}(x-\mu) }
cdf: (no analytic expression)
ค่าเฉลี่ย: μ
ฐานนิยม: μ
ความแปรปรวน: Σ
เอนโทรปี: \ln\!\sqrt{(2\pi e)^k |\Sigma|}
mgf: \exp\!\Big( \mu't + \tfrac{1}{2} t'\Sigma t\Big)
cf: \exp\!\Big( i\mu't - \tfrac{1}{2} t'\Sigma t\Big)

การแจกแจงแบบปรกติหลายตัวแปร (อังกฤษ: multivariate normal distribution) เป็นการขยายวางนัยทั่วไปจากการแจกแจงแบบปรกติ (ตัวแปรเดียว) ไปเป็นหลายมิติ(หลายตัวแปร) เวกเตอร์สุ่มที่มีการแจกแจงแบบปรกติหลายตัวแปร คือ ทุกๆผลรวมเชิงเส้น (linear combination) ของส่วนประกอบของเวกเตอร์มีการแจกแจงเป็นการแจกแจงแบบปรกติ

การแจกแจงแบบปรกติหลายตัวแปร มักใช้อธิบาย เซตของตัวแปรสุ่มหลายๆตัวที่มีความสัมพันธ์กัน โดยที่แต่ค่าของตัวแปรจะมีค่าเกาะกลุ่มอยู่ใกล้ๆกับค่ามัชฌิม

สัญลักษณ์เครื่องหมายและการใช้พารามิเตอร์[แก้]

การแจกแจงแบบปรกติหลายตัวแปร ของเวกเตอร์สุ่ม k มิติ (k-dimensional random vector) X = [X1, X2, …, Xk] สามารถเขียนได้ดังนี้:


    X\ \sim\ \mathcal{N}(\mu,\, \Sigma),

หรือสามารถระบุจำนวนมิติของตัวแปรได้ดังนี้


    X\ \sim\ \mathcal{N}_k(\mu,\, \Sigma).

โดยเวกเตอร์ค่ามัชฌิมที่มี k มิติ คือ

 \mu = [ \operatorname{E}[X_1], \operatorname{E}[X_2], \ldots, \operatorname{E}[X k]]

และ เมตริกซ์ของความแปรปรวนร่วมเกี่ยว (covariance matrix) ขนาด k x k คือ

 \Sigma = [\operatorname{Cov}[X i, X j]]_{i=1,2,\ldots,k; j=1,2,\ldots,k}

คำนิยาม[แก้]

เวกเตอร์สุ่ม X = (X1, …, Xk)′จะมีการแจกแจงแบบปรกติหลายตัวแปรได้ก็ต่อเมื่อเงื่อนไขดังนี้[1]:

บทความที่เกี่ยวข้อง[แก้]

อ้างอิง[แก้]

  1. Gut, Allan: An Intermediate Course in Probability, 2009, chapter 5