MeCab
นักพัฒนา | คุโด ทากุ (工藤拓) |
---|---|
ที่เก็บข้อมูล | |
ภาษาที่เขียน | C++, C#, จาวา, เพิร์ล, ไพธอน, รูบี |
แพลตฟอร์ม | ข้ามแพลตฟอร์ม |
ประเภท | การวิเคราะห์หน่วยคำ |
สัญญาอนุญาต | GPL, LGPL, BSD |
เว็บไซต์ | https://taku910.github.io/mecab/ |
MeCab เป็นเครื่องมือโอเพนซอร์สสำหรับการวิเคราะห์หน่วยคำที่พัฒนาโดยคุโด ทากุ (工藤拓) จากสถาบันวิทยาศาสตร์และเทคโนโลยีนาระ[1][2] โดยชื่อนี้มีที่มาจาก เมกาบุ (和布蕪) ซึ่งเป็นอาหารโปรดของผู้พัฒนา
ในช่วงเริ่มต้นของการพัฒนา มีพื้นฐานมาจาก ChaSen และได้รับการพัฒนาภายใต้ชื่อ ChaSenTNG แต่ปัจจุบันกำลังได้รับการพัฒนาตั้งแต่เริ่มต้นโดยไม่ขึ้นอยู่กับ ChaSen ความแม่นยำในการวิเคราะห์ใกล้เคียงกับ ChaSen แต่ความเร็วในการวิเคราะห์เร็วกว่าโดยเฉลี่ย 3-4 เท่า
การวิเคราะห์และการประมาณค่าสามารถทำได้โดยใช้ข้อมูลส่วนหนึ่งของคำพูด มีพจนานุกรมหลายฉบับที่สามารถใช้กับ MeCab ได้ แต่ที่ใช้โดยทั่วไปคือ IPADIC เช่นเดียวกับ ChaSen
MeCab ยังใช้เพื่อสร้างข้อมูล n-gram ภาษาญี่ปุ่นขนาดใหญ่ที่เผยแพร่โดยกูเกิล[3]
นอกจากนี้ยังใช้สำหรับ Spotlight ใน Mac OS X v10.5 และ v10.6 [4] การป้อนข้อมูลภาษาญี่ปุ่นใน iPhone OS 2.1[5] และ OS X Yosemite [6]
อ้างอิง
[แก้]- ↑ "「ググる」の精度を高めるために必要なもの - @IT自分戦略研究所". ITmedia. 2006-03-15. สืบค้นเมื่อ 2009-04-09.
- ↑ "思いどおりの日本語入力 - Google 日本語入力". Google. 2009-12-03. สืบค้นเมื่อ 2009-12-03.
- ↑ "Google Japan Blog: 大規模日本語 n-gram データの公開". Google. 2007-11-01. สืบค้นเมื่อ 2009-04-09.
- ↑ "iPhoneの仮名漢字変換はMeCabを利用". 2009-12-03. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2008-09-18. สืบค้นเมื่อ 2009-12-03.
- ↑ "「日本語入力」の基本". MacFan. สืบค้นเมื่อ 2020-05-30.
- ↑ "大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google)". 2009-12-03. สืบค้นเมื่อ 2009-12-03.