ข้ามไปเนื้อหา

การก่อกำเนิดภาษาธรรมชาติ

จากวิกิพีเดีย สารานุกรมเสรี

การก่อกำเนิดภาษาธรรมชาติ (natural language generation) เป็นส่วนหนึ่งของสาขาการประมวลภาษาธรรมชาติ หมายถึงการสร้างภาษาธรรมชาติ จากระบบเครื่องจักรหรือคอมพิวเตอร์ เช่น โดยใช้ฐานความรู้ หรือ รูปแบบเชิงตรรกะ

อาจกล่าวได้ว่าเป็นสิ่งที่ตรงกันข้ามกับกระบวนการการเข้าใจภาษาธรรมชาติ ซึ่งเป็นกระบวนการการทำให้ประโยคป้อนเข้ามีความกระจ่างขึ้นแล้วแปลงเป็นภาษาที่เครื่องเข้าใจได้ แต่กระบวนการการก่อกำเนิดภาษาธรรมชาตินั้นจำเป็นต้องมีการตัดสินเกี่ยวกับวิธีการแสดงแนวคิดด้วยคำพูด

การประยุกต์ใช้โดยทั่วไปนั้นได้แก่การสร้างข้อความต่าง ๆ เช่นการรายงานอากาศ[1] หรืออาการป่วย[2] การสร้างข้อความจากภาพ[3] รวมไปถึงการสร้างจักรกลสนทนา

ภาพรวม

[แก้]

กระบวนการสร้างข้อความสามารถทำได้ง่ายเพียงแค่เชื่อมต่อคำที่เลือกจากรายการความคิดโบราณกับข้อความที่เชื่อมโยง ซึ่งจะสร้างข้อความที่เพียงพอสำหรับด้านต่าง ๆ เช่น เครื่องทำนาย หรือจดหมายธุรกิจส่วนบุคคล เป็นต้น แต่ระบบการก่อกำเนิดภาษาธรรมชาติที่ซับซ้อนนั้นจำเป็นต้องมีขั้นตอนของการบูรณาการข้อมูลและการวางแผนเพื่อสร้างประโยคที่ดูเป็นธรรมชาติและดูไม่เหมือนความคิดตายตัวซ้ำซาก

ขั้นตอนทั่วไปมีดังนี้

- การตัดสินบริบท
ทำการตัดสินใจว่าสมบัติ/ลักษณะใดที่ควรค่าแก่การกล่าวถึง เทคนิคที่ใช้ในขั้นตอนนี้เกี่ยวข้องกับการทำเหมืองข้อมูล
- แผนเรียงความ
ทำการจัดระเบียบการนำเสนอข้อมูลโดยรวม
- บูรณาการประโยค
รวมประโยคที่คล้ายกันเพื่อปรับปรุงให้อ่านง่าย และเป็นธรรมชาติ
- ทำให้เป็นคำศัพท์
ทำการแทนที่แนวคิดด้วยคำพูด
- การสร้างนิพจน์อ้างอิง
ทำการเชื่อมโยงคำในประโยคโดยนำเสนอวิธีการแสดงออกที่ให้ความหมายแทนสิ่งที่อ้างอิง เช่น คำสรรพนาม
- การประมวลผลทางวากยสัมพันธ์/หน่วยคำ
เป็นการดำเนินการย้อนกลับการวิเคราะห์ไวยากรณ์ การใช้ข้อมูลทั้งหมดที่รวบรวมไว้ในขั้นตอนก่อนหน้านี้จะใช้กฎทางวากยสัมพันธ์ และ วิทยาหน่วยคำ เพื่อสร้างสายอักขระที่แสดงถึงประโยคจริง
- การประมวลผลออร์โทกราฟิก
เกี่ยวกับการใช้อักษรตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก เครื่องหมายวรรคตอน การจัดรูปแบบ ฯลฯ

อ้างอิง

[แก้]
  1. Goldberg E, Driedger N, Kittredge R (1994). "Using Natural-Language Processing to Produce Weather Forecasts". IEEE Expert. 9 (2): 45–53. doi:10.1109/64.294135. S2CID 9709337.
  2. Portet F, Reiter E, Gatt A, Hunter J, Sripada S, Freer Y, Sykes C (2009). "Automatic Generation of Textual Summaries from Neonatal Intensive Care Data" (PDF). Artificial Intelligence. 173 (7–8): 789–816. doi:10.1016/j.artint.2008.12.002.
  3. Farhadi A, Hejrati M, Sadeghi MA, Young P, Rashtchian C, Hockenmaier J, Forsyth D (2010-09-05). Every picture tells a story: Generating sentences from images (PDF). European conference on computer vision. Berlin, Heidelberg: Springer. pp. 15–29. doi:10.1007/978-3-642-15561-1_2.