ยูนิโคด

จากวิกิพีเดีย สารานุกรมเสรี

The Unicode Standard, Version 5.0
The Unicode Standard, Version 5.0

ในวิทยาการคอมพิวเตอร์ ยูนิโคด (Unicode) คือมาตรฐานอุตสาหกรรมที่ช่วยให้คอมพิวเตอร์แสดงผลและจัดการเทกซ์ (text) หรือข้อความตัวอักษรที่ใช้ในระบบการเขียนของภาษาส่วนใหญ่ในโลกได้อย่างสอดคล้องกัน ยูนิโคดประกอบด้วยรายการอักขระที่แสดงผลได้ 98,884 ตัว (รุ่น 5.0)[1] วางเรียงกันตามรหัสของมาตรฐานชุดอักขระสากล (Universal Character Set: UCS) และมีการตีพิมพ์ลงในหนังสือ The Unicode Standard เพื่อใช้เป็นรายการอ้างอิง นอกจากนั้นยังมีการอธิบายวิธีการที่ใช้เข้ารหัสและการนำเสนอมาตรฐานของการเข้ารหัสอักขระอีกจำนวนหนึ่ง การเรียงลำดับอักษร กฎเกณฑ์ของการรวมและการแยกอักขระ รวมไปถึงลำดับการแสดงผลของอักขระสองทิศทาง (เช่นอักษรอาหรับหรืออักษรฮีบรูที่เขียนจากขวาไปซ้าย)[2]

ยูนิโคดคอนซอร์เทียม (Unicode Consortium) ซึ่งเป็นองค์กรไม่แสวงหาผลกำไร เป็นผู้รับผิดชอบในการพัฒนายูนิโคด องค์กรนี้มีจุดมุ่งหมายเกี่ยวกับการแทนที่การเข้ารหัสอักขระที่มีอยู่ด้วยยูนิโคดและมาตรฐานรูปแบบการแปลงยูนิโคด (Unicode Transformation Format: UTF) แต่ก็เป็นที่ยุ่งยากเนื่องจากแผนการที่มีอยู่ถูกจำกัดไว้ด้วยขนาดและขอบเขต ซึ่งอาจไม่รองรับกับสภาพแวดล้อมหลายภาษาในคอมพิวเตอร์

ความสำเร็จของยูนิโคดในเรื่องของการรวมการเข้ารหัสอักขระให้เป็นหนึ่ง เป็นที่รู้จักกว้างขวางและมีอิทธิพลต่อการทำซอฟต์แวร์ให้เป็นสากล กล่าวคือสามารถใช้ได้หลายภาษา มาตรฐานนี้มีการนำไปใช้เป็นเทคโนโลยีหลักหลายอย่าง อาทิ เอกซ์เอ็มแอล ภาษาจาวา และระบบปฏิบัติการสมัยใหม่

เนื้อหา

[แก้] รุ่นยูนิโคด

  • Unicode 1.0: ตุลาคม พ.ศ. 2534[3]
  • Unicode 1.0.1: มิถุนายน พ.ศ. 2535[4]
  • Unicode 1.1: มิถุนายน พ.ศ. 2536[5]
  • Unicode 2.0: กรกฎาคม พ.ศ. 2539[6]
  • Unicode 2.1: พฤษภาคม พ.ศ. 2541
  • Unicode 2.1.2: พฤษภาคม พ.ศ. 2541[7]
  • Unicode 3.0: กันยายน พ.ศ. 2542 [8]
  • Unicode 3.1: มีนาคม พ.ศ. 2544
  • Unicode 3.2: มีนาคม พ.ศ. 2545
  • Unicode 4.0: เมษายน พ.ศ. 2546[9]
  • Unicode 4.0.1: มีนาคม พ.ศ. 2547
  • Unicode 4.1: มีนาคม พ.ศ. 2548
  • Unicode 5.0: กรกฎาคม พ.ศ. 2549[10]
  • Unicode 5.1: เมษายน พ.ศ. 2551[11]


[แก้] ข้อจำกัดและปัญหา

มีการวิจารณ์ยูนิโคดเกี่ยวกับปัญหาทางเทคนิค และข้อจำกัดต่าง ๆ อย่างไรก็ดี ยูนิโคดได้กลายเป็นวิธีการเข้ารหัสที่ใช้กันมากที่สุดในการทำให้ซอฟต์แวร์และระบบปฏิบัติการใช้ได้หลายภาษาพร้อม ๆ กัน

ระบบปฏิบัติการตระกูลวินโดวส์ ได้แก่วินโดวส์เอ็นที, วินโดวส์ 2000 และ วินโดวส์เอกซ์พี ใช้รหัสยูนิโคดแบบ UTF-16 ในการเข้ารหัสข้อความ ระบบปฏิบัติการที่คล้ายกับยูนิกซ์ เช่น GNU/Linux BSD และ Mac OS X ก็ได้นำยูนิโคดแบบ UTF-8 มาใช้ เป็นพื้นฐานของการแทนข้อความที่มีหลายภาษา

การรองรับภาษาไทยในยูนิโคด ได้รับการวิพากษ์วิจารณ์เนื่องจากว่าลำดับเรียงตัวอักษรนั้นไม่ถูกต้องตามที่ควรจะเป็น ซึ่งเป็นเพราะว่ายูนิโคดในส่วนภาษาไทยได้อ้างอิงรูปแบบเดิมจาก Thai Industry Standard 620 (TIS-620) ที่มีปัญหานี้เช่นกัน จึงทำให้การเทียบเรียงลำดับยูนิโคดยุ่งยากขึ้น

[แก้] อ้างอิง

  1. ^ http://www.unicode.org/versions/Unicode5.0.0/
  2. ^ http://www.unicode.org/standard/principles.html#What_Characters
  3. ^ ISBN 0-201-56788-1
  4. ^ ISBN 0-201-60845-6
  5. ^ Previous 2 Publications, and, Unicode Technical Report #4:The Unicode Standard, Version 1.1 by Mark Davis
  6. ^ ISBN 0-201-48345-9
  7. ^ Previous 3 Publications, and, Unicode Technical Report #8, The Unicode Standard, Version 2.1 by Lisa Moore
  8. ^ ISBN 0-201-61633-5
  9. ^ ISBN 0-321-18578-1
  10. ^ (The character database, aka. UCD, published on 18 July 2006; the book, The Unicode Standard, Version 5.0 was released on 9 November 2006. ISBN 0321480910
  11. ^ http://www.unicode.org/press/pr-5.1.html

[แก้] แหล่งข้อมูลอื่น

ยูนิโคด เป็นบทความเกี่ยวกับ ซอฟต์แวร์ หรือ โปรแกรมคอมพิวเตอร์ ที่ยังไม่สมบูรณ์ ต้องการตรวจสอบ เพิ่มเนื้อหา หรือเพิ่มแหล่งอ้างอิง คุณสามารถช่วยเพิ่มเติมหรือแก้ไข เพื่อให้สมบูรณ์มากขึ้น
ข้อมูลเกี่ยวกับ ยูนิโคด ในภาษาอื่น อาจสามารถหาอ่านได้จากเมนู ภาษาอื่น ด้านซ้ายมือ

เครื่องมือส่วนตัว