ผู้ใช้:Choteseeworld/กระบะทราย

จากวิกิพีเดีย สารานุกรมเสรี

ขั้นตอนวิธี - ซี[แก้]

ในวิทยาการคอมพิวเตอร์ ขั้นตอนวิธีนี้ คือ ขั้นตอนวิธีที่เอาไว้ใช้ในการหารูปแบบคำ(pattern)ในคำ(text) โดยเราให้ความยาวของคำ(text) เป็น n และคำเป็น m แล้วผลรวมของเวลาที่ใช้ในการประมวลผล คือ O(n+m) ซึ่งจะเหมือนกับขั้นตอนวิธีของคนูธ-มอร์ริส-แพรตต์

ขั้นตอนวิธี-ซี เป็นขั้นตอนวิธีแบบตรงไปตรงมา (Brute-Force algorithm) ซึ่งเกิดจากการทำงานวนลูปรูปแบบคำ(pattern) n ครั้ง และวนรูปคำ(text) อีก m ครั้ง ทำให้ประสิทธิภาพของเวลาการทำงานของโปรแกรมเป็น O(n+m)

หลักการ[แก้]

หลักการของขั้นตอนวิธี-ซีนั้น แบ่งขั้นตอนการทำงานออกเป็น 3 ขั้นตอน

1.       สร้างสตริงขึ้นมาใหม่ ซึ่งเกิดจากนำเอา Pattern + $ + Text โดยเครื่องหมาย $ เป็นเครื่องหมายที่เราสมมติขึ้นมาเพื่อขั้นระหว่าง Pattern และ Text เพื่อให้ง่ายต่อการตรวจสอบ

ตัวอย่าง

Text = “ABCABCABCD” และ Pattern = “ABCD”

New string S = “ABCD$ABCABCABCD”

2.       สร้างอาเรย์ขึ้นมา 1 อาเรย์ เรียกว่า Z-array ซึ่งภายในจะประกอบไปด้วย Z-Value และ Z-value จะทำให้เกิด Z-box ขึ้น

3.       เมื่อมีคำที่เหมือนกับ Pattern เกิดขึ้น เราสามารถสังเกตได้จาก Z-value ที่มีความยาวเท่ากับ ความยาวของ Pattren

Z-array คืออะไร ?[แก้]

Z-array คืออาเรย์ใหม่ ที่เกิดจากการต่อกันระหว่าง Pattern กับ Text ซึ่งจะมีผลในการหาค่าของ Z-value และยังเป็นขั้นตอนที่สำคัญมากใน string matching ด้วยวิธี Z-algorithm

ตัวอย่าง

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string A B C D $ A B C A B C A B C D

Z-value คืออะไร ?[แก้]

Z-value คือค่าตัวเลขที่ได้จากการทำงานวนลูปซ้อนกัน โดยลูปนอกเป็นอินเด็กซ์ที่ทุกตัวอักษร (สมมติเป็น index k) และลูปในคืออินเด็กซ์ที่ Pattern ใน New String S

หลักการสร้าง Z-value[แก้]

เราต้องสมมติ Z-box ขึ้นมา ซึ่ง Z-box นี้ คือ กล่องสตริงย่อยที่ตรงกับ Pattern ที่อยู่ด้านหน้า โดยเราจะให้ lt คือ ตัวอักษรด้านซ้ายสุดของกล่อง และ rt คือ ตัวอักษรด้านขวามือของกล่อง

ตัวอย่างการสร้าง Z-value

1.Z algorithm จะเริ่มที่ k = 1, lt = 0, rt = 0

ให้ Z(0) คือความยาวของ Z-array = 15 ที่ k=1 S(1) ไม่เหมือนกับ S(0) ดังนั้นจึงไม่เกิด Z-box ขึ้น ค่าของอินเด็กซ์ lt และ rt ก็ยังคงเป็น 0

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0

Z(1) = 0 , lt =0, rt = 0

2.ต่อไปขยับอินเด็กซ์ k เป็น k= 2

ที่ k=2 S(2) ไม่เหมือนกับ S(0) ดังนั้นจึงไม่เกิด Z-box ขึ้น ค่าของอินเด็กซ์ lt และ rt ก็ยังคงเป็น 0

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0

Z(2) = 0 , lt =0, rt = 0

3.ต่อไปขยับอินเด็กซ์ k เป็น k= 3

ที่ k=3 S(3) ไม่เหมือนกับ S(0) ดังนั้นจึงไม่เกิด Z-box ขึ้น ค่าของอินเด็กซ์ lt และ rt ก็ยังคงเป็น 0

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0

Z(3) = 0 , lt =0, rt = 0

4.ต่อไปขยับอินเด็กซ์ k เป็น k= 4

ที่ k=4 S(4) ไม่เหมือนกับ S(0) ดังนั้นจึงไม่เกิด Z-box ขึ้น ค่าของอินเด็กซ์ lt และ rt ก็ยังคงเป็น 0

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0

Z(4) = 0 , lt =0, rt = 0

5.ต่อไปขยับอินเด็กซ์ k เป็น k= 5

ที่ k=5 S(5) เหมือน S(0), S(6) เหมือน S(1) และ S(7) เหมือน S(2) ดังนั้น Z(5) = 3 และเกิด Z-box ทำให้ lt = 5 และ rt = 7

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3

           Z(5) = 3, lt =5, rt = 7

6.ต่อไปขยับอินเด็กซ์ k เป็น k= 6

ที่  k = 6 อยู่ใน substring ก่อนหน้า ซึ่ง(rt = 7) และ substring ย่อยก่อนหน้านี้เริ่มต้นที่ k-lt (6-5) โดย Z(1) = 0  ซึ่ง < substring ที่เหลือ S[6…7] ดังนั้น Z(6) = Z(1) = 0 โดยไม่ต้องมีการคำนวณเพิ่มเติม

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0

Z(6) = 0, lt = 5, rt = 7

7.ต่อไปขยับอินเด็กซ์ k เป็น k= 7

ที่  k = 7 อยู่ใน substring ก่อนหน้า ซึ่ง(rt = 7) และ substring ย่อยก่อนหน้านี้เริ่มต้นที่ k-lt (7-5) โดย Z(2) = 0  ซึ่ง < substring ที่เหลือ S[7…7] ดังนั้น Z(7) = Z(2) = 0 โดยไม่ต้องมีการคำนวณเพิ่มเติม

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0

Z(7) = 0, lt = 5, rt = 7

8.ต่อไปขยับอินเด็กซ์ k เป็น k= 8

ที่ k=8 S(8) เหมือน S(0), S(9) เหมือน S(1) และ S(10) เหมือน S(2) ดังนั้น S(8) = 3 และเกิด Z-box ทำให้ lt = 8 และ rt = 10

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3

Z(8) = 3, lt = 8, rt = 10

9.ต่อไปขยับอินเด็กซ์ k เป็น k= 9

ที่  k = 9 อยู่ใน substring ก่อนหน้า ซึ่ง (rt = 10) และ substring ย่อยก่อนหน้านี้เริ่มต้นที่ k-lt (9-8) โดย Z(1) = 0  ซึ่ง < substring ที่เหลือ S[9…10] ดังนั้น Z(9) = Z(1) = 0 โดยไม่ต้องมีการคำนวณเพิ่มเติม

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0

Z(9) = 0, lt = 8, rt = 10

10.ต่อไปขยับอินเด็กซ์ k เป็น k= 10

ที่  k = 10 อยู่ใน substring ก่อนหน้า ซึ่ง r = 10 และ substring ย่อยก่อนหน้านี้เริ่มต้นที่ k-lt (10-8) โดย Z(2) = 0  ซึ่ง < substring ที่เหลือ S[10…10] ดังนั้น Z(10) = Z(2) = 0 โดยไม่ต้องมีการคำนวณเพิ่มเติม

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0 0

Z(10) = 0, lt = 8, rt = 10

11.ต่อไปขยับอินเด็กซ์ k เป็น k= 11

ที่ k=11 S(11) เหมือน S(0), S(12) เหมือน S(1),  S(13) เหมือน S(2) และ S(14) เหมือน S(3) ดังนั้น Z(11) = 4 และเกิด Z-box ทำให้ lt = 11 และ rt = 14

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0 0 4

Z(11) = 4, lt = 11, rt = 14

12.ต่อไปขยับอินเด็กซ์ k เป็น k= 12

ที่  k = 12 อยู่ใน substring ก่อนหน้า ซึ่ง (rt = 14) และ substring ย่อยก่อนหน้านี้เริ่มต้นที่ k-lt (12-11) โดย Z(1) = 0  ซึ่ง < substring ที่เหลือ S[12…14] ดังนั้น Z(12) = Z(1) = 0 โดยไม่ต้องมีการคำนวณเพิ่มเติม

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0 0 4 0

Z(12) = 0, lt = 11, rt = 14

13.ต่อไปขยับอินเด็กซ์ k เป็น k= 13

ที่  k = 13 อยู่ใน substring ก่อนหน้า ซึ่ง (rt = 14) และ substring ย่อยก่อนหน้านี้เริ่มต้นที่ k-lt (13-11) โดย Z(2) = 0  ซึ่ง < substring ที่เหลือ S[13…14] ดังนั้น Z(13) = Z(2) = 0 โดยไม่ต้องมีการคำนวณเพิ่มเติม

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0 0 4 0 0

Z(13) = 0, lt = 11, rt = 14

14.ต่อไปขยับอินเด็กซ์ k เป็น k= 14

ที่  k = 14 อยู่ใน substring ก่อนหน้า ซึ่ง (rt = 14) และ substring ย่อยก่อนหน้านี้เริ่มต้นที่ k-lt (14-11) โดย Z(3) = 0  ซึ่ง < substring ที่เหลือ S[14…14] ดังนั้น Z(14) = Z(3) = 0 โดยไม่ต้องมีการคำนวณเพิ่มเติม

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0 0 4 0 0 0

Z(14) = 0, lt = 11, rt = 14

15.Z-array ที่สมบูรณ์ จะเป็นดังนี้

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0 0 4 0 0 0

มี Pattern อยู่ใน Text กี่ตำแหน่ง ?[แก้]

เราจะทราบได้อย่างไรว่ามี Pattern อยู่ใน Text หรือไม่??? Pattern = “ABCD” ซึ่งมีความยาวเป็น 4 และ เราจะพบ Z-value ที่มีค่าเท่ากับความยาว Pattern คือ 4 ที่ตำแหน่งที่ 11 ของ Z-array ซึ่ง ถ้าเอา Z(11) - |Pattern+1| = 11-5 = 6 ซึ่ง ตรงกับ Text ในตำแหน่งที่ 6 พอดี

position 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
New string S A B C D $ A B C A B C A B C D
Z-value 15 0 0 0 0 3 0 0 3 0 0 4 0 0 0

อ้างอิง[แก้]

Ivan Yurchenko. (October 15, 2013). Z algorithm. สืบค้นเมื่อ 25 เมษายน 2561. จาก Yet another programming blog : https://ivanyu.me/blog/2013/10/15/z-algorithm/

Utkarsh Trivedi.Z algorithm (Linear time pattern searching Algorithm). สืบค้นเมื่อ 25 เมษายน 2561. จาก GeeksforGeeks : https://www.geeksforgeeks.org/z-algorithm-linear-time-pattern-searching-algorithm/