การแปลภาษาอัตโนมัติ

จากวิกิพีเดีย สารานุกรมเสรี

การแปลภาษาอัตโนมัติ (MT; machine translation) เป็นศาสตร์ย่อยของภาษาศาสตร์เชิงคำนวณที่เกี่ยวกับการใช้ซอฟต์แวร์คอมพิวเตอร์แปลข้อความหรือคำพูดภาษาธรรมชาติภาษาหนึ่งไปเป็นอีกภาษาหนึ่ง ยกตัวอย่างเช่น การใช้ซอฟต์แวร์คอมพิวเตอร์แปลข้อความภาษาไทย ไปเป็นภาษาอังกฤษ เป็นต้น ในระดับพื้นฐาน การแปลภาษาอัตโนมัติทำได้โดยการแทนที่คำในภาษาหนึ่งด้วยคำในอีกภาษาหนึ่ง (การแปลคำต่อคำ) อย่างไรก็ตามการแปลภาษาโดยใช้การแทนที่คำอย่างง่ายไม่เพียงพอต่อการแปลภาษาให้ถูกต้อง เพราะภาษามีความคลุมเครือ ยกตัวอย่างเช่น คำว่า bank ในภาษาอังกฤษมีความเป็นไปได้ที่จะแปลเป็นคำภาษาไทย ได้ทั้งคำว่า "ธนาคาร" และ "ตลิ่ง" เป็นต้น นอกจากนั้นภาษายังแตกต่างกันในเรื่องสำนวนและไวยากรณ์ ยกตัวอย่างเช่น "il fait froid" ในภาษาฝรั่งเศส แปลว่า "อากาศหนาว" ในภาษาไทย แต่ถ้าหากแปลคำต่อคำจะแปลว่า "มันทำหนาว" เป็นต้น เนื่องจากการแปลด้วยการแทนที่คำอย่างง่ายมีข้อจำกัด จึงมีการใช้เทคนิคการแปลภาษาอัตโนมัติต่างๆ เช่น การเรียนรู้การแปลอัตโนมัติจากคลังข้อความขนาน และการวิเคราะห์ทางภาษาศาสตร์ เป็นต้น

ขั้นตอนในการแปลภาษาสามารถแบ่งออกเป็น 2 ขั้นตอน ได้แก่

  1. การถอดรหัสความหมายจากข้อความในภาษาต้นทาง
  2. การเข้ารหัสความหมายไปเป็นข้อความในภาษาปลายทาง

ขั้นตอนในการแปลดังกล่าว เป็นทั้งขั้นตอนในการแปลภาษาอัตโนมัติ และการแปลความหมายโดยนักแปลด้วย ยกตัวอย่างเช่น ในการแปลภาษาฝรั่งเศสเป็นภาษาไทยโดยนักแปล ขึ้นตอนในการแปลคือ นักแปลถอดรหัสข้อความภาษาฝรั่งเศสให้เป็นความหมายที่นักแปลเข้าใจ จากนั้นนักแปลจึงเข้ารหัสความหมายที่ตนเองเข้าใจไปเป็นข้อความภาษาไทย

เบื้องหลังขั้นตอนที่ดูง่ายและเห็นได้ชัดเจนนี้อาศัยการดำเนินการทางกระบวนการความคิดที่ซับซ้อน เพื่อที่จะถอดรหัสความหมายของข้อความภาษาต้นทาง ต้องใช้ความรู้ที่ลึกซึ้งเกี่ยวกับไวยากรณ์ อรรถศาสตร์ วากยสัมพันธ์ สำนวน ฯลฯ ของภาษาต้นทาง รวมถึงความเข้าใจในวัฒนธรรมของผู้กล่าวด้วย ผู้แปลต้องการความรู้ที่ลึกซึ้งในลักษณะคล้ายกับการถอดรหัส เพื่อเข้ารหัสความหมายให้เป็นข้อความภาษาปลายทาง

[แก้] ประเภทของการแปลภาษาอัตโนมัติ

สามเหลี่ยมของโวกัวส์แสดงระดับสถาปัตยกรรมทางภาษาศาสตร์ในการแปลภาษาอัตโนมัติ

การแปลภาษาอัตโนมัติสามารถแบ่งเป็นประเภทต่างๆ โดยพิจารณาตามสถาปัตยกรรมทางภาษาศาสตร์ และสถาปัตยกรรมทางการคำนวณ[1]

การเปลี่ยนภาษาต้นทางไปเป็นภาษาปลายทางสามารถทำได้โดยการแปลตรงไปตรงมาในระดับคำ อย่างไรก็ตามเพื่อแก้ปัญหาการแปลไม่ถูกต้อง ที่เกิดจากสาเหตุ เช่น ความแตกต่างกันของภาษาต้นทางและภาษาปลายทาง ฯลฯ ความรู้ด้านภาษาศาสตร์จึงถูกนำมาใช้ในการแปลภาษา ต่างไปจากการแปลตรงไปตรงมา การโอนถ่ายสามารถโอนถ่ายโครงสร้าง เช่น โครงสร้างต้นไม้วากยสัมพันธ์จากภาษาต้นทางที่ได้มาจากการวิเคราะห์ ไปเป็นโครงสร้างต้นไม้วากยสัมพันธ์ของภาษาปลายทาง จากนั้นจึงสร้างข้อความภาษาปลายทางจากโครงสร้างต้นไม้วากยสัมพันธ์ของภาษาปลายทางที่ได้มาจากการโอนถ่าย เป็นต้น โครงสร้างและการจัดการระบบที่ระบบระดับการวิเคราะห์ การสร้างและการโอนถ่าย เช่น การแปลภาษาอัตโนมัติโดยการโอนถ่ายโครงสร้างต้นไม้วากยสัมพันธ์ การแปลภาษาอัตโนมัติแบบตรงไปตรงมาระดับคำ ฯลฯ คือสถาปัตยกรรมทางภาษาศาสตร์ของการแปลอัตโนมัติ

[แก้] อ้างอิง

  1. ^ Christian Boitet, Youcef Bey, Mutsuko Tomokiyo, Wenjie Cao, and Hervé Blanchon. IWSLT-06: experiments with commercial systems and lessons for subjective evaluations., in presentation slide of the International Workshop on Spoken Language Translation. Kyoto, Japan. 2006.
คอมพิวเตอร์ การแปลภาษาอัตโนมัติ เป็นบทความเกี่ยวกับ คอมพิวเตอร์ อุปกรณ์คอมพิวเตอร์ หรือ เครือข่าย ที่ยังไม่สมบูรณ์ ต้องการตรวจสอบ เพิ่มเนื้อหาหรือเพิ่มแหล่งอ้างอิง คุณสามารถช่วยเพิ่มเติมหรือแก้ไข เพื่อให้สมบูรณ์มากขึ้น
ข้อมูลเกี่ยวกับ การแปลภาษาอัตโนมัติ ในภาษาอื่น อาจสามารถหาอ่านได้จากเมนู ภาษาอื่น ด้านซ้ายมือ หรือ ดูเพิ่มที่ สถานีย่อย:เทคโนโลยีสารสนเทศ