การก่อกำเนิดภาษาธรรมชาติ
การก่อกำเนิดภาษาธรรมชาติ (natural language generation) เป็นส่วนหนึ่งของสาขาการประมวลภาษาธรรมชาติ หมายถึงการสร้างภาษาธรรมชาติ จากระบบเครื่องจักรหรือคอมพิวเตอร์ เช่น โดยใช้ฐานความรู้ หรือ รูปแบบเชิงตรรกะ
อาจกล่าวได้ว่าเป็นสิ่งที่ตรงกันข้ามกับกระบวนการการเข้าใจภาษาธรรมชาติ ซึ่งเป็นกระบวนการการทำให้ประโยคป้อนเข้ามีความกระจ่างขึ้นแล้วแปลงเป็นภาษาที่เครื่องเข้าใจได้ แต่กระบวนการการก่อกำเนิดภาษาธรรมชาตินั้นจำเป็นต้องมีการตัดสินเกี่ยวกับวิธีการแสดงแนวคิดด้วยคำพูด
การประยุกต์ใช้โดยทั่วไปนั้นได้แก่การสร้างข้อความต่าง ๆ เช่นการรายงานอากาศ[1] หรืออาการป่วย[2] การสร้างข้อความจากภาพ[3] รวมไปถึงการสร้างจักรกลสนทนา
ภาพรวม
[แก้]กระบวนการสร้างข้อความสามารถทำได้ง่ายเพียงแค่เชื่อมต่อคำที่เลือกจากรายการความคิดโบราณกับข้อความที่เชื่อมโยง ซึ่งจะสร้างข้อความที่เพียงพอสำหรับด้านต่าง ๆ เช่น เครื่องทำนาย หรือจดหมายธุรกิจส่วนบุคคล เป็นต้น แต่ระบบการก่อกำเนิดภาษาธรรมชาติที่ซับซ้อนนั้นจำเป็นต้องมีขั้นตอนของการบูรณาการข้อมูลและการวางแผนเพื่อสร้างประโยคที่ดูเป็นธรรมชาติและดูไม่เหมือนความคิดตายตัวซ้ำซาก
ขั้นตอนทั่วไปมีดังนี้
- - การตัดสินบริบท
- ทำการตัดสินใจว่าสมบัติ/ลักษณะใดที่ควรค่าแก่การกล่าวถึง เทคนิคที่ใช้ในขั้นตอนนี้เกี่ยวข้องกับการทำเหมืองข้อมูล
- - แผนเรียงความ
- ทำการจัดระเบียบการนำเสนอข้อมูลโดยรวม
- - บูรณาการประโยค
- รวมประโยคที่คล้ายกันเพื่อปรับปรุงให้อ่านง่าย และเป็นธรรมชาติ
- - ทำให้เป็นคำศัพท์
- ทำการแทนที่แนวคิดด้วยคำพูด
- - การสร้างนิพจน์อ้างอิง
- ทำการเชื่อมโยงคำในประโยคโดยนำเสนอวิธีการแสดงออกที่ให้ความหมายแทนสิ่งที่อ้างอิง เช่น คำสรรพนาม
- - การประมวลผลทางวากยสัมพันธ์/หน่วยคำ
- เป็นการดำเนินการย้อนกลับการวิเคราะห์ไวยากรณ์ การใช้ข้อมูลทั้งหมดที่รวบรวมไว้ในขั้นตอนก่อนหน้านี้จะใช้กฎทางวากยสัมพันธ์ และ วิทยาหน่วยคำ เพื่อสร้างสายอักขระที่แสดงถึงประโยคจริง
- - การประมวลผลออร์โทกราฟิก
- เกี่ยวกับการใช้อักษรตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก เครื่องหมายวรรคตอน การจัดรูปแบบ ฯลฯ
อ้างอิง
[แก้]- ↑ Goldberg E, Driedger N, Kittredge R (1994). "Using Natural-Language Processing to Produce Weather Forecasts". IEEE Expert. 9 (2): 45–53. doi:10.1109/64.294135. S2CID 9709337.
- ↑ Portet F, Reiter E, Gatt A, Hunter J, Sripada S, Freer Y, Sykes C (2009). "Automatic Generation of Textual Summaries from Neonatal Intensive Care Data" (PDF). Artificial Intelligence. 173 (7–8): 789–816. doi:10.1016/j.artint.2008.12.002.
- ↑ Farhadi A, Hejrati M, Sadeghi MA, Young P, Rashtchian C, Hockenmaier J, Forsyth D (2010-09-05). Every picture tells a story: Generating sentences from images (PDF). European conference on computer vision. Berlin, Heidelberg: Springer. pp. 15–29. doi:10.1007/978-3-642-15561-1_2.