ลูซีน
|
|
ลิงก์ข้ามภาษาในบทความนี้ มีไว้เพื่อความสะดวกในการศึกษาเพิ่มเติมของผู้อ่านและผู้ร่วมแก้ไขบทความ เนื่องจากคำดังกล่าวยังไม่มีบทความในภาษาไทย ป้ายนี้จะถูกนำออกเมื่อมีเนื้อหาพอสมควรแล้ว |
| ผู้พัฒนา | มูลนิธิซอฟต์แวร์อาแพชี |
|---|---|
| รุ่นล่าสุด | 2.3.2 / 6 พฤษภาคม 2551 |
| ระบบปฏิบัติการ | ข้ามแพลตฟอร์ม |
| ประเภท | การค้นหาข้อมูล and การสร้างดัชนี ส่วนต่อประสานโปรแกรมประยุกต์. |
| ลิขสิทธิ์ | สัญญาอนุญาตซอฟต์แวร์อาแพชี |
| เว็บไซต์ | lucene.apache.org |
ลูซีน (Lucene) เป็นซอฟต์แวร์เสรีและซอฟต์แวร์โอเพนซอร์สสำหรับใช้เป็นส่วนต่อประสานโปรแกรมประยุกต์ในการค้นคืนสารสนเทศ แต่เดิมลูซีนถูกเขียนขึ้นโดยใช้ภาษาจาวา โดย Doug Cutting ซึ่งสนับสนุนโดยมูลนิธิซอฟต์แวร์อาแพชี และเผยแพร่โดยใช้สัญญาอนุญาตซอฟต์แวร์อาแพชี ลูซีนถูกย้ายไปเขียนขึ้นด้วยภาษาอื่น ๆ นอกจากภาษาจาวาด้วย ได้แก่ ภาษาเพิร์ล ภาษาซีชาร์ป ภาษาซีพลัสพลัส ภาษาไพทอน ภาษารูบี้ และภาษาพีเอชพี
ลูซีนเหมาะกับการใช้งานใดที่ต้องการการสร้างดัชนีข้อความอย่างเต็มรูปแบบ (Full-text indexing) และความสามารถในการค้นคืนข้อความแบบเต็มรูปแบบ (Full-text searching) ลูซีนได้รับการยอมรับอย่างกว้างขวางในการนำไปใช้สร้างเครื่องมือช่วยค้นหาข้อมูลสำหรับอินเทอร์เน็ต หรือ ภายในองค์กร หรือ เฉพาะในเว็บไซต์เดียว ซึ่งบางครั้งก็มีผู้เข้าใจผิดว่าลูซีนเป็นเครื่องมือช่วยค้นหาข้อมูลเต็มรูปแบบ ที่มีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML ด้วย ทั้งนี้โปรแกรมที่ใช้งานลูซีนจะต้องมีมีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML โดยแยกออกจากลูซีน
สิ่งที่อยู่ในแก่นของสถาปัตยกรรมเชิงตรรกะของลูซีนคือแนวคิดว่าเอกสารประกอบไปด้วยเขตข้อมูลของข้อความ ซึ่งทำให้ส่วนต่อประสานโปรแกรมประยุกต์ของลูซีนยืดหยุ่นพอที่จะไม่ขึ้นอยู่กับรูปแบบไฟล์ ข้อความจากไฟล์ในรูปแบบ PDF HTML เอกสารไมโครซอฟท์เวิร์ด และรูปแบบอื่น ๆ อีกมากมายสามารถนำมาสร้างดัชนีได้ตราบเท่าที่สามารถสกัดข้อความจากเอกสารได้
โครงการที่ใช้ลูซีน [แก้]
- วิกิพีเดียใช้ลูซีนในการค้นหาแบบเต็มรูปแบบ
- บีเกิลใช้ลูซีนที่ย้ายไปเขียนด้วยภาษาซีชาร์ป ชื่อว่า Lucene.Net สำหรับสร้างดัชนี
- Docco (โฮมเพจ) ใช้ลูซีนในการค้นหาในเครื่องส่วนบุคคล (Desktop search)
- DSpace (โฮมเพจ) ใช้ลูซีน