ลูซีน

จากวิกิพีเดีย สารานุกรมเสรี
ลูซีน
Lucene
Lucene logo
ผู้พัฒนา มูลนิธิซอฟต์แวร์อาแพชี
รุ่นล่าสุด 2.3.2 / 6 พฤษภาคม 2551
ระบบปฏิบัติการ ข้ามแพลตฟอร์ม
ประเภท การค้นหาข้อมูล and การสร้างดัชนี ส่วนต่อประสานโปรแกรมประยุกต์.
ลิขสิทธิ์ สัญญาอนุญาตซอฟต์แวร์อาแพชี
เว็บไซต์ lucene.apache.org

ลูซีน (Lucene) เป็นซอฟต์แวร์เสรีและซอฟต์แวร์โอเพนซอร์สสำหรับใช้เป็นส่วนต่อประสานโปรแกรมประยุกต์ในการค้นคืนสารสนเทศ แต่เดิมลูซีนถูกเขียนขึ้นโดยใช้ภาษาจาวา โดย Doug Cutting ซึ่งสนับสนุนโดยมูลนิธิซอฟต์แวร์อาแพชี และเผยแพร่โดยใช้สัญญาอนุญาตซอฟต์แวร์อาแพชี ลูซีนถูกย้ายไปเขียนขึ้นด้วยภาษาอื่น ๆ นอกจากภาษาจาวาด้วย ได้แก่ ภาษาเพิร์ล ภาษาซีชาร์ป ภาษาซีพลัสพลัส ภาษาไพทอน ภาษารูบี้ และภาษาพีเอชพี

ลูซีนเหมาะกับการใช้งานใดที่ต้องการการสร้างดัชนีข้อความอย่างเต็มรูปแบบ (Full-text indexing) และความสามารถในการค้นคืนข้อความแบบเต็มรูปแบบ (Full-text searching) ลูซีนได้รับการยอมรับอย่างกว้างขวางในการนำไปใช้สร้างเครื่องมือช่วยค้นหาข้อมูลสำหรับอินเทอร์เน็ต หรือ ภายในองค์กร หรือ เฉพาะในเว็บไซต์เดียว ซึ่งบางครั้งก็มีผู้เข้าใจผิดว่าลูซีนเป็นเครื่องมือช่วยค้นหาข้อมูลเต็มรูปแบบ ที่มีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML ด้วย ทั้งนี้โปรแกรมที่ใช้งานลูซีนจะต้องมีมีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML โดยแยกออกจากลูซีน

สิ่งที่อยู่ในแก่นของสถาปัตยกรรมเชิงตรรกะของลูซีนคือแนวคิดว่าเอกสารประกอบไปด้วยเขตข้อมูลของข้อความ ซึ่งทำให้ส่วนต่อประสานโปรแกรมประยุกต์ของลูซีนยืดหยุ่นพอที่จะไม่ขึ้นอยู่กับรูปแบบไฟล์ ข้อความจากไฟล์ในรูปแบบ PDF HTML เอกสารไมโครซอฟท์เวิร์ด และรูปแบบอื่น ๆ อีกมากมายสามารถนำมาสร้างดัชนีได้ตราบเท่าที่สามารถสกัดข้อความจากเอกสารได้

โครงการที่ใช้ลูซีน[แก้]

อ้างอิง[แก้]