เพจแรงก์

จากวิกิพีเดีย สารานุกรมเสรี
ตัวอย่างเพจแรงก์สำหรับเครือข่ายอย่างง่าย (ค่าจาก 100) แสดงถึง หน้า B มีค่าเพจแรงก์สูงสุด เพราะมีจำนวนหน้าที่ลิงก์เข้าหามากสุด แต่ทว่า หน้า C มีเพจแรงก์สูงกว่าหน้า E แม้ว่าจะมีหน้าที่ลิงก์มาหน้าน้อยกว่า แต่หน้าที่มีน้ำหนักลิงก์เข้าหาหน้า C

เพจแรงก์ (PageRank) คือขั้นตอนวิธีที่ใช้การวิเคราะห์เว็บลิงก์ตามทฤษฎีเครือข่ายที่ใช้เป็นพื้นฐานในตัวเสิร์ชเอนจินของกูเกิล โดยเพจแรงก์จะแสดงเป็นค่าตัวเลขบ่งบอกถึงความความสำคัญของข้อมูลในกลุ่มของชุดข้อมูล ตัวเลขของเพจแรงก์ของกูเกิลในปัจจุบันจะมีค่าระหว่าง 0 ถึง 10 (ถูกคำนวณค่าในลักษณะลอการิทึม) แสดงถึงความสำคัญของหน้านั้นบนตัวค้นหาของกูเกิล หน้าที่มีเพจแรงก์สูงจะปรากฏขึ้นมาก่อนหน้าที่มีเพจแรงก์ต่ำ ค่าของเพจแรงก์ถูกคำนวณจากจำนวนการอ้างถึงจากหน้าอื่น และน้ำหนักของหน้าที่ลิงก์เข้ามาหา

ประวัติ[แก้]

เพจแรงก์ถูกพัฒนาขึ้นที่มหาวิทยาลัยสแตนฟอร์ด โดย แลร์รี เพจ (และเป็นที่มาของชื่อ เพจแรงก์ (ความหมายเป็นนัยว่า อันดับของเพจ)[1]) โดยเริ่มต้นเมื่อปี พ.ศ. 2538 และต่อมา เซอร์เกย์ บริน นักศึกษามหาวิทยาลัยเดียวกันได้เข้ามาร่วมงานวิจัยนี้ ร่วมกันพัฒนาและได้ร่วมก่อตั้งบริษัทกูเกิล ในปี 2541

เพจแรงก์ได้มีการพัฒนาภายใต้ทฎษฎีการวิเคราะห์การอ้างถึงข้อมูลของ ยูจีน การ์ฟิลด์ (Eugene Garfield) จากมหาวิทยาลัยเพนซิลเวเนีย ซึ่งชื่อของยูจีนได้มีการอ้างถึงในต้นฉบับของวิทยานิพนธ์นั้น

"PageRank" เป็นเครื่องหมายการค้าของกูเกิลซึ่งได้ถูกจดสิทธิบัตร (U.S. Patent 6,285,999) โดยมหาวิทยาลัยสแตนฟอร์ด ซึ่งทางบริษัทกูเกิลได้นำมาใช้แลกเปลี่ยนกับจำนวนหุ้นกับทางมหาวิทยาลัยในจำนวนเงินเทียบเท่า 1.8 ล้านหุ้น ซึ่งราคา 336 ล้านดอลลาร์สหรัฐ[2][3]

ขั้นตอนวิธี[แก้]

เพจแรงก์เป็นการแจกแจงความน่าจะเป็นที่เป็นค่าเฉลี่ยของการใช้งานเว็บไซต์โดยสุ่มค่าความน่าจะเป็นระหว่าง 0 ถึง 1 โดยค่า 0.5 เป็นค่าโอกาส 50% ที่โอกาสจะเกิดขึ้น

ตัวอย่างขั้นตอนวิธี[แก้]

การทำงานของเพจแรงก์

จำลองค่าเว็บเพจสี่หน้า A B C และ D ค่าเริ่มต้นของเพจแรงก์ในแต่ละหน้าจะมีค่าเท่ากันคือ 0.25 ซึ่งรวมทั้งหมดจะมีค่าเท่ากับ 1

ถ้าหน้า B C และ D ลิงก์ไปยังหน้า A จะเป็นการให้คะแนน 0.25 เพจแรงก์ต่อหน้า A ซึ่งค่าเพจแรงก์ เขียนว่า PR( ) ในระบบจะกลายเป็น

PR(A)= PR(B) + PR(C) + PR(D).\,

ซึ่งมีค่าเป็น 0.75

และถ้าหน้า B ยังคงลิงก์ไปยังหน้า C ขณะที่หน้า D ลิงก์ไปยังทุกหน้า ทำให้คะแนนจากหน้า B ถูกแบ่งออกสำหรับ A และ C เหลือเพียง 0.125 ขณะที่คะแนนจาก D จะเหลือให้แต่ละหน้าเป็นหนึ่งในสาม (ประมาณ 0.083)

PR(A)= (1-D)+D*(\frac{(PR(B)}{2}+ \frac{PR(C)}{1}+ \frac{PR(D)}{3}).\,

ซึ่งสามารถเขียนเป็นสมการได้ว่า เพจแรงก์ที่ให้คะแนนต่อหน้าอื่นนับตามลิงก์ที่ชี้ไปยังหน้าอื่น L( ) มีค่าเท่ากับคะแนนเพจแรงก์ของหน้านั้นหารด้วยจำนวนลิงก์ที่ชี้ออกไป

PR(A)= \frac{PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D)}. \,

และสมการในลักษณะทั่วไปสำหรับหน้าใดๆ คือ

PR(u) = \sum_{v \in B_u} \frac{PR(v)}{L(v)}

ข้อเสนอ "rel='nofollow'" ของกูเกิล[แก้]

ในต้นปี 2548 กูเกิลได้มีข้อเสนอให้เพิ่มเติมค่าของ "nofollow" ในส่วนของ rel[4] เพื่อให้นักพัฒนาเว็บไซต์สามารถเลือกได้ว่าจะนำลิงก์ในส่วนนั้นมาร่วมในระบบให้คะแนนของเพจแรงก์หรือไม่ ซึ่งใช้สำหรับป้องกันปัญหาสแปมและสแปมเด็กซ์ ตัวอย่างเช่นการสแปมโดยการโฆษณาเว็บไซต์ตัวเองตามเว็บบอร์ด ซึ่งถ้าแอดมินของเว็บนั้นใส่ค่า "rel='nofollow'" ไว้ในส่วนเนื้อหา จะทำให้เว็บไซต์นั้นไม่ถูกนำมาคำนวณค่าเพจแรงก์

อ้างอิง[แก้]

  1. David Vise and Mark Malseed (2005). The Google Story. p. 37. ISBN ISBN 0-553-80457-X Check |isbn= value (help). 
  2. Lisa M. Krieger (1 December 2005). "Stanford Earns $336 Million Off Google Stock". San Jose Mercury News, cited by redOrbit. สืบค้นเมื่อ 2009-02-25. 
  3. Richard Brandt. "Starting Up. How Google got its groove". Stanford magazine. สืบค้นเมื่อ 2009-02-25. 
  4. "Preventing Comment Spam". Google. สืบค้นเมื่อ January 01 2005.  Unknown parameter |dateformat= ignored (help);