ขั้นตอนวิธีเชิงสัทลักษณ์
หน้าตา
บทความนี้ไม่มีการอ้างอิงจากแหล่งที่มาใด |
ขั้นตอนวิธีเชิงสัทลักษณ์ (อังกฤษ: phonetic algorithm) คือขั้นตอนวิธีสำหรับการกำหนดดัชนีของคำต่างๆ โดยใช้การออกเสียงเป็นเกณฑ์ ขั้นตอนวิธีเชิงสัทลักษณ์ส่วนใหญ่พัฒนาขึ้นเพื่อใช้กับภาษาอังกฤษ ดังนั้นการใช้กฎเกณฑ์ดังกล่าวกับคำในภาษาอื่นอาจไม่ให้ผลลัพธ์ที่มีความหมาย ขั้นตอนวิธีเหล่านั้นมีความซับซ้อนด้วยกฎและข้อยกเว้นหลายประการ เนื่องจากการสะกดคำ และการออกเสียงในภาษาอังกฤษถูกทำให้ยุ่งยากด้วยการเปลี่ยนแปลงทางประวัติศาสตร์และคำที่ยืมมาจากภาษาอื่นหลายภาษา
ขั้นตอนเชิงสัทลักษณ์
[แก้]ขั้นตอนวิธีเชิงสัทลักษณ์ที่เป็นที่รู้จักมีดังนี้
- ซาวเดกซ์ (Soundex) พัฒนาขึ้นเพื่อใช้เข้ารหัสนามสกุลในการทำสำมะโนประชากร รหัสของซาวเดกซ์ประกอบด้วยอักษรละติน 1 ตัวตามด้วยตัวเลขอีก 3 หลัก
- ซาวเดกซ์ของเดตช์-โมโคทอฟฟ์ (Daitch-Mokotoff Soundex) เป็นการนำซาวเดกซ์มาปรับปรุงใหม่ให้ดีขึ้นเพื่อใช้กับนามสกุลที่มาจากภาษากลุ่มสลาวิกและภาษายิดดิช รหัสของซาวเดกซ์ของเดตช์-โมโคทอฟฟ์ประกอบด้วยตัวเลขทั้งหมด 6 หลัก
- เมทาโฟน (Metaphone) และ ดับเบิลเมทาโฟน (Double Metaphone) เหมาะสมที่จะใช้กับคำในภาษาอังกฤษทั่วไป ไม่เพียงแต่เฉพาะชื่อบุคคล ขั้นตอนวิธีแบบเมทาโฟนเป็นรากฐานของซอฟต์แวร์ตรวจการสะกดคำหลายโปรแกรม
- New York State Identification and Intelligence System (NYSIIS) เป็นการจับคู่หน่วยเสียง (phoneme) ที่คล้ายกันให้เข้ากับอักษรตัวเดียวกัน ให้ผลลัพธ์เป็นสายอักขระซึ่งสามารถอ่านได้โดยไม่ต้องถอดรหัส
- การเข้าหาด้วยการจัดระดับคู่ (Match Rating Approach) ถูกพัฒนาขึ้นโดยสายการบินเวสเทอร์นแอร์ไลน์เมื่อปี พ.ศ. 2520 ใช้เทคนิคการเข้ารหัสและเปรียบเทียบ
ดูเพิ่ม
[แก้]- ระยะทางแฮมมิง (Hammimg distance)
- ระยะทางเลเวนชเตย์น (Levenshtein distance)