การแปลภาษาอัตโนมัติ
จากวิกิพีเดีย สารานุกรมเสรี
การแปลภาษาอัตโนมัติ (MT; machine translation) เป็นศาสตร์ย่อยของภาษาศาสตร์เชิงคำนวณที่เกี่ยวกับการใช้ซอฟต์แวร์คอมพิวเตอร์แปลข้อความหรือคำพูดภาษาธรรมชาติภาษาหนึ่งไปเป็นอีกภาษาหนึ่ง ยกตัวอย่างเช่น การใช้ซอฟต์แวร์คอมพิวเตอร์แปลข้อความภาษาไทย ไปเป็นภาษาอังกฤษ เป็นต้น ในระดับพื้นฐาน การแปลภาษาอัตโนมัติทำได้โดยการแทนที่คำในภาษาหนึ่งด้วยคำในอีกภาษาหนึ่ง (การแปลคำต่อคำ) อย่างไรก็ตามการแปลภาษาโดยใช้การแทนที่คำอย่างง่ายไม่เพียงพอต่อการแปลภาษาให้ถูกต้อง เพราะภาษามีความคลุมเครือ ยกตัวอย่างเช่น คำว่า bank ในภาษาอังกฤษมีความเป็นไปได้ที่จะแปลเป็นคำภาษาไทย ได้ทั้งคำว่า "ธนาคาร" และ "ตลิ่ง" เป็นต้น นอกจากนั้นภาษายังแตกต่างกันในเรื่องสำนวนและไวยากรณ์ ยกตัวอย่างเช่น "il fait froid" ในภาษาฝรั่งเศส แปลว่า "อากาศหนาว" ในภาษาไทย แต่ถ้าหากแปลคำต่อคำจะแปลว่า "มันทำหนาว" เป็นต้น เนื่องจากการแปลด้วยการแทนที่คำอย่างง่ายมีข้อจำกัด จึงมีการใช้เทคนิคการแปลภาษาอัตโนมัติต่างๆ เช่น การเรียนรู้การแปลอัตโนมัติจากคลังข้อความขนาน และการวิเคราะห์ทางภาษาศาสตร์ เป็นต้น
ขั้นตอนในการแปลภาษาสามารถแบ่งออกเป็น 2 ขั้นตอน ได้แก่
- การถอดรหัสความหมายจากข้อความในภาษาต้นทาง
- การเข้ารหัสความหมายไปเป็นข้อความในภาษาปลายทาง
ขั้นตอนในการแปลดังกล่าว เป็นทั้งขั้นตอนในการแปลภาษาอัตโนมัติ และการแปลความหมายโดยนักแปลด้วย ยกตัวอย่างเช่น ในการแปลภาษาฝรั่งเศสเป็นภาษาไทยโดยนักแปล ขึ้นตอนในการแปลคือ นักแปลถอดรหัสข้อความภาษาฝรั่งเศสให้เป็นความหมายที่นักแปลเข้าใจ จากนั้นนักแปลจึงเข้ารหัสความหมายที่ตนเองเข้าใจไปเป็นข้อความภาษาไทย
เบื้องหลังขั้นตอนที่ดูง่ายและเห็นได้ชัดเจนนี้อาศัยการดำเนินการทางกระบวนการความคิดที่ซับซ้อน เพื่อที่จะถอดรหัสความหมายของข้อความภาษาต้นทาง ต้องใช้ความรู้ที่ลึกซึ้งเกี่ยวกับไวยากรณ์ อรรถศาสตร์ วากยสัมพันธ์ สำนวน ฯลฯ ของภาษาต้นทาง รวมถึงความเข้าใจในวัฒนธรรมของผู้กล่าวด้วย ผู้แปลต้องการความรู้ที่ลึกซึ้งในลักษณะคล้ายกับการถอดรหัส เพื่อเข้ารหัสความหมายให้เป็นข้อความภาษาปลายทาง
[แก้] ประเภทของการแปลภาษาอัตโนมัติ
การแปลภาษาอัตโนมัติสามารถแบ่งเป็นประเภทต่างๆ โดยพิจารณาตามสถาปัตยกรรมทางภาษาศาสตร์ และสถาปัตยกรรมทางการคำนวณ[1]
การเปลี่ยนภาษาต้นทางไปเป็นภาษาปลายทางสามารถทำได้โดยการแปลตรงไปตรงมาในระดับคำ อย่างไรก็ตามเพื่อแก้ปัญหาการแปลไม่ถูกต้อง ที่เกิดจากสาเหตุ เช่น ความแตกต่างกันของภาษาต้นทางและภาษาปลายทาง ฯลฯ ความรู้ด้านภาษาศาสตร์จึงถูกนำมาใช้ในการแปลภาษา ต่างไปจากการแปลตรงไปตรงมา การโอนถ่ายสามารถโอนถ่ายโครงสร้าง เช่น โครงสร้างต้นไม้วากยสัมพันธ์จากภาษาต้นทางที่ได้มาจากการวิเคราะห์ ไปเป็นโครงสร้างต้นไม้วากยสัมพันธ์ของภาษาปลายทาง จากนั้นจึงสร้างข้อความภาษาปลายทางจากโครงสร้างต้นไม้วากยสัมพันธ์ของภาษาปลายทางที่ได้มาจากการโอนถ่าย เป็นต้น โครงสร้างและการจัดการระบบที่ระบบระดับการวิเคราะห์ การสร้างและการโอนถ่าย เช่น การแปลภาษาอัตโนมัติโดยการโอนถ่ายโครงสร้างต้นไม้วากยสัมพันธ์ การแปลภาษาอัตโนมัติแบบตรงไปตรงมาระดับคำ ฯลฯ คือสถาปัตยกรรมทางภาษาศาสตร์ของการแปลอัตโนมัติ
[แก้] อ้างอิง
- ^ Christian Boitet, Youcef Bey, Mutsuko Tomokiyo, Wenjie Cao, and Hervé Blanchon. IWSLT-06: experiments with commercial systems and lessons for subjective evaluations., in presentation slide of the International Workshop on Spoken Language Translation. Kyoto, Japan. 2006.
| การแปลภาษาอัตโนมัติ เป็นบทความเกี่ยวกับ คอมพิวเตอร์ อุปกรณ์คอมพิวเตอร์ หรือ เครือข่าย ที่ยังไม่สมบูรณ์ ต้องการตรวจสอบ เพิ่มเนื้อหาหรือเพิ่มแหล่งอ้างอิง คุณสามารถช่วยเพิ่มเติมหรือแก้ไข เพื่อให้สมบูรณ์มากขึ้น ข้อมูลเกี่ยวกับ การแปลภาษาอัตโนมัติ ในภาษาอื่น อาจสามารถหาอ่านได้จากเมนู ภาษาอื่น ด้านซ้ายมือ หรือ ดูเพิ่มที่ สถานีย่อย:เทคโนโลยีสารสนเทศ |