ข้ามไปเนื้อหา

MeCab

จากวิกิพีเดีย สารานุกรมเสรี
MeCab
นักพัฒนาคุโด ทากุ (工藤拓)
ที่เก็บข้อมูล
ภาษาที่เขียนC++, C#, จาวา, เพิร์ล, ไพธอน, รูบี
แพลตฟอร์มข้ามแพลตฟอร์ม
ประเภทการวิเคราะห์หน่วยคำ
สัญญาอนุญาตGPL, LGPL, BSD
เว็บไซต์https://taku910.github.io/mecab/

MeCab เป็นเครื่องมือโอเพนซอร์สสำหรับการวิเคราะห์หน่วยคำที่พัฒนาโดยคุโด ทากุ (工藤拓) จากสถาบันวิทยาศาสตร์และเทคโนโลยีนาระ[1][2] โดยชื่อนี้มีที่มาจาก เมกาบุ (和布蕪) ซึ่งเป็นอาหารโปรดของผู้พัฒนา

ในช่วงเริ่มต้นของการพัฒนา มีพื้นฐานมาจาก ChaSen และได้รับการพัฒนาภายใต้ชื่อ ChaSenTNG แต่ปัจจุบันกำลังได้รับการพัฒนาตั้งแต่เริ่มต้นโดยไม่ขึ้นอยู่กับ ChaSen ความแม่นยำในการวิเคราะห์ใกล้เคียงกับ ChaSen แต่ความเร็วในการวิเคราะห์เร็วกว่าโดยเฉลี่ย 3-4 เท่า

การวิเคราะห์และการประมาณค่าสามารถทำได้โดยใช้ข้อมูลส่วนหนึ่งของคำพูด มีพจนานุกรมหลายฉบับที่สามารถใช้กับ MeCab ได้ แต่ที่ใช้โดยทั่วไปคือ IPADIC เช่นเดียวกับ ChaSen

MeCab ยังใช้เพื่อสร้างข้อมูล n-gram ภาษาญี่ปุ่นขนาดใหญ่ที่เผยแพร่โดยกูเกิล[3]

นอกจากนี้ยังใช้สำหรับ Spotlight ใน Mac OS X v10.5 และ v10.6 [4] การป้อนข้อมูลภาษาญี่ปุ่นใน iPhone OS 2.1[5] และ OS X Yosemite [6]

อ้างอิง

[แก้]
  1. "「ググる」の精度を高めるために必要なもの - @IT自分戦略研究所". ITmedia. 2006-03-15. สืบค้นเมื่อ 2009-04-09.
  2. "思いどおりの日本語入力 - Google 日本語入力". Google. 2009-12-03. สืบค้นเมื่อ 2009-12-03.
  3. "Google Japan Blog: 大規模日本語 n-gram データの公開". Google. 2007-11-01. สืบค้นเมื่อ 2009-04-09.
  4. "iPhoneの仮名漢字変換はMeCabを利用". 2009-12-03. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2008-09-18. สืบค้นเมื่อ 2009-12-03.
  5. "「日本語入力」の基本". MacFan. สืบค้นเมื่อ 2020-05-30.
  6. "大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google)". 2009-12-03. สืบค้นเมื่อ 2009-12-03.