การถดถอยโลจิสติก
การถดถอยโลจิสติก (logistic regression) เป็นรูปแบบหนึ่งของแบบจำลองการวิเคราะห์การถดถอยสำหรับตัวแปรที่เป็นไปตามการแจกแจงแบร์นุลลี นอกจากนี้ยังเป็นตัวแบบเชิงเส้นนัยทั่วไป ประเภทหนึ่งที่ใช้ลอจิตเป็นฟังก์ชันถ่ายโอน ตีพิมพ์โดยเดวิด ค็อกซ์ ในปี 1958[1] เป็นวิธีการวิเคราะห์การถดถอยแบบหนึ่งที่มักใช้การจำแนกประเภทข้อมูลในทางสถิติศาสตร์
แบบจำลองนี้เทียบเท่ากับเพอร์เซปตรอนแบบง่ายซึ่งได้ตีพิมพ์ในปี 1958 ด้วย อย่างไรก็ตาม ในไลบรารีการเรียนรู้ของเครื่อง เช่น scikit-learn ฯลฯ แบบจำลองที่ใช้การเคลื่อนลงตามความชันแบบเฟ้นสุ่มในการกำหนดพารามิเตอร์ในปัญหาการหาค่าเหมาะที่สุดจะถูกเรียกว่า "เพอร์เซปตรอน" ในขณะที่แบบจำลองที่ใช้ การสืบสายพิกัด หรือ วิธีการนิวตันเสมือน จึงจะถูกเรียกว่า "การถดถอยโลจิสติก"
ภาพรวม
[แก้]ให้ x เป็นข้อมุลป้อนเข้า p เป็นความน่าจะเป็น (ค่าขาออก) และ α และ β เป็นพารามิเตอร์ แบบจำลองการถดถอยโลจิสติกจะแสดงได้ดังต่อไปนี้
ในที่นี้มี n หน่วยและความแปรปรวนร่วม X และความสัมพันธ์เป็นดังนี้
ลอการิทึมของอัตราส่วนออดส์ของผลลัพธ์ จำลองเป็นฟังก์ชันเชิงเส้นของตัวแปรอธิบาย X i สามารถแสดงได้ดังนี้
เมื่อใช้สัญลักษณ์เพอร์เซพตรอนอย่างง่าย สมการข้างต้นสามารถแสดงได้ดังต่อไปนี้
โดยในที่นี้ เป็นฟังก์ชันซิกมอยด์มาตรฐาน
การประมาณค่าพารามิเตอร์ส่งผลอย่างมากต่ออัตราส่วนออดส์ สำหรับตัวแปรอธิบายที่เป็นได้ 2 ค่า เช่น เพศ แล้ว เช่น การประมาณอัตราส่วนออดส์ของผลลัพธ์สำหรับชายและหญิง ในการประมาณค่ามักใช้วิธีภาวะน่าจะเป็นสูงสุด
อ้างอิง
[แก้]- ↑ Cox, DR (1958). "The regression analysis of binary sequences (with discussion)". J Roy Stat Soc B. 20: 215–242.