ยูนิโคด
จากวิกิพีเดีย สารานุกรมเสรี
ในวิทยาการคอมพิวเตอร์ ยูนิโคด (Unicode) คือมาตรฐานอุตสาหกรรมที่ช่วยให้คอมพิวเตอร์แสดงผลและจัดการเทกซ์ (text) หรือข้อความตัวอักษรที่ใช้ในระบบการเขียนของภาษาส่วนใหญ่ในโลกได้อย่างสอดคล้องกัน ยูนิโคดประกอบด้วยรายการอักขระที่แสดงผลได้ 98,884 ตัว (รุ่น 5.0)[1] วางเรียงกันตามรหัสของมาตรฐานชุดอักขระสากล (Universal Character Set: UCS) และมีการตีพิมพ์ลงในหนังสือ The Unicode Standard เพื่อใช้เป็นรายการอ้างอิง นอกจากนั้นยังมีการอธิบายวิธีการที่ใช้เข้ารหัสและการนำเสนอมาตรฐานของการเข้ารหัสอักขระอีกจำนวนหนึ่ง การเรียงลำดับอักษร กฎเกณฑ์ของการรวมและการแยกอักขระ รวมไปถึงลำดับการแสดงผลของอักขระสองทิศทาง (เช่นอักษรอาหรับหรืออักษรฮีบรูที่เขียนจากขวาไปซ้าย)[2]
ยูนิโคดคอนซอร์เทียม (Unicode Consortium) ซึ่งเป็นองค์กรไม่แสวงหาผลกำไร เป็นผู้รับผิดชอบในการพัฒนายูนิโคด องค์กรนี้มีจุดมุ่งหมายเกี่ยวกับการแทนที่การเข้ารหัสอักขระที่มีอยู่ด้วยยูนิโคดและมาตรฐานรูปแบบการแปลงยูนิโคด (Unicode Transformation Format: UTF) แต่ก็เป็นที่ยุ่งยากเนื่องจากแผนการที่มีอยู่ถูกจำกัดไว้ด้วยขนาดและขอบเขต ซึ่งอาจไม่รองรับกับสภาพแวดล้อมหลายภาษาในคอมพิวเตอร์
ความสำเร็จของยูนิโคดในเรื่องของการรวมการเข้ารหัสอักขระให้เป็นหนึ่ง เป็นที่รู้จักกว้างขวางและมีอิทธิพลต่อการทำซอฟต์แวร์ให้เป็นสากล กล่าวคือสามารถใช้ได้หลายภาษา มาตรฐานนี้มีการนำไปใช้เป็นเทคโนโลยีหลักหลายอย่าง อาทิ เอกซ์เอ็มแอล ภาษาจาวา และระบบปฏิบัติการสมัยใหม่
เนื้อหา |
[แก้] รุ่นยูนิโคด
- Unicode 1.0: ตุลาคม พ.ศ. 2534[3]
- Unicode 1.0.1: มิถุนายน พ.ศ. 2535[4]
- Unicode 1.1: มิถุนายน พ.ศ. 2536[5]
- Unicode 2.0: กรกฎาคม พ.ศ. 2539[6]
- Unicode 2.1: พฤษภาคม พ.ศ. 2541
- Unicode 2.1.2: พฤษภาคม พ.ศ. 2541[7]
- Unicode 3.0: กันยายน พ.ศ. 2542 [8]
- Unicode 3.1: มีนาคม พ.ศ. 2544
- Unicode 3.2: มีนาคม พ.ศ. 2545
- Unicode 4.0: เมษายน พ.ศ. 2546[9]
- Unicode 4.0.1: มีนาคม พ.ศ. 2547
- Unicode 4.1: มีนาคม พ.ศ. 2548
- Unicode 5.0: กรกฎาคม พ.ศ. 2549[10]
- Unicode 5.1: เมษายน พ.ศ. 2551[11]
[แก้] ข้อจำกัดและปัญหา
มีการวิจารณ์ยูนิโคดเกี่ยวกับปัญหาทางเทคนิค และข้อจำกัดต่าง ๆ อย่างไรก็ดี ยูนิโคดได้กลายเป็นวิธีการเข้ารหัสที่ใช้กันมากที่สุดในการทำให้ซอฟต์แวร์และระบบปฏิบัติการใช้ได้หลายภาษาพร้อม ๆ กัน
ระบบปฏิบัติการตระกูลวินโดวส์ ได้แก่วินโดวส์เอ็นที, วินโดวส์ 2000 และ วินโดวส์เอกซ์พี ใช้รหัสยูนิโคดแบบ UTF-16 ในการเข้ารหัสข้อความ ระบบปฏิบัติการที่คล้ายกับยูนิกซ์ เช่น GNU/Linux BSD และ Mac OS X ก็ได้นำยูนิโคดแบบ UTF-8 มาใช้ เป็นพื้นฐานของการแทนข้อความที่มีหลายภาษา
การรองรับภาษาไทยในยูนิโคด ได้รับการวิพากษ์วิจารณ์เนื่องจากว่าลำดับเรียงตัวอักษรนั้นไม่ถูกต้องตามที่ควรจะเป็น ซึ่งเป็นเพราะว่ายูนิโคดในส่วนภาษาไทยได้อ้างอิงรูปแบบเดิมจาก Thai Industry Standard 620 (TIS-620) ที่มีปัญหานี้เช่นกัน จึงทำให้การเทียบเรียงลำดับยูนิโคดยุ่งยากขึ้น
[แก้] อ้างอิง
- ^ http://www.unicode.org/versions/Unicode5.0.0/
- ^ http://www.unicode.org/standard/principles.html#What_Characters
- ^ ISBN 0-201-56788-1
- ^ ISBN 0-201-60845-6
- ^ Previous 2 Publications, and, Unicode Technical Report #4:The Unicode Standard, Version 1.1 by Mark Davis
- ^ ISBN 0-201-48345-9
- ^ Previous 3 Publications, and, Unicode Technical Report #8, The Unicode Standard, Version 2.1 by Lisa Moore
- ^ ISBN 0-201-61633-5
- ^ ISBN 0-321-18578-1
- ^ (The character database, aka. UCD, published on 18 July 2006; the book, The Unicode Standard, Version 5.0 was released on 9 November 2006. ISBN 0321480910
- ^ http://www.unicode.org/press/pr-5.1.html
[แก้] แหล่งข้อมูลอื่น
- DecodeUnicode - Unicode WIKI, 50.000 gifs
| ยูนิโคด เป็นบทความเกี่ยวกับ ซอฟต์แวร์ หรือ โปรแกรมคอมพิวเตอร์ ที่ยังไม่สมบูรณ์ ต้องการตรวจสอบ เพิ่มเนื้อหา หรือเพิ่มแหล่งอ้างอิง คุณสามารถช่วยเพิ่มเติมหรือแก้ไข เพื่อให้สมบูรณ์มากขึ้น ข้อมูลเกี่ยวกับ ยูนิโคด ในภาษาอื่น อาจสามารถหาอ่านได้จากเมนู ภาษาอื่น ด้านซ้ายมือ |

