คลังข้อความขนาน

จากวิกิพีเดีย สารานุกรมเสรี

คลังข้อความขนาน (อังกฤษ: Parallel text) คือ ข้อความต้นฉบับและข้อความภาษาอื่นๆ ที่แปลมาจากข้อความต้นฉบับ ในคลังข้อความขนานระบุส่วนตรงกัน มีการระบุประโยคที่ตรงกันของคู่ข้อความที่ต่างภาษา ดังตัวอย่างในตารางด้านล่าง

ข้อความต้นฉบับภาษาอังกฤษ
ข้อความที่แปลเป็นภาษาไทย
A parallel text is a text in one language together with its translation in another language. คลังข้อความขนานคือข้อความต้นฉบับและข้อความภาษาอื่นๆ ที่แปลมาจากข้อความต้นฉบับ
Parallel text alignment is the identification of the corresponding sentences in both halves of the parallel text. ในคลังข้อความขนานระบุส่วนตรงกันมีการระบุประโยคที่ตรงกันของคู่ข้อความต่างภาษา

การระบุประโยคที่ตรงกันในคลังข้อความขนาน มีความสำคัญในการศึกษาวิจัยในหลายสาขาย่อยของภาษาศาสตร์ ในการแปลภาษา ประโยคหลายประโยคสามารถแปลรวมกันเป็นประโยคเดียว หรือไม่แปลบางประโยค หรือเพิ่มประโยคใหม่ที่ไม่มีในข้อความต้นฉบับ หรือเปลี่ยนลำดับของประโยคในเอกสารแปลและเอกสารต้นฉบับให้ไม่ตรงกัน ด้วยสาเหตุข้างต้นการระบุประโยคที่ตรงกันในคลังข้อความขนานจึงไม่ใช่เรื่องตรงไปตรงมา

ในการแปลภาษาด้วยเครื่อง (machine translation) คลังข้อความขนานมีประโยชน์อย่างมาก เมื่อใช้ร่วมกับการเรียนรู้ของเครื่อง โดยให้เครื่องเรียนการแปลจากประโยคตัวอย่าง

ดูเพิ่ม[แก้ไขต้นฉบับ]