UTF-16/UCS-2
จากวิกิพีเดีย สารานุกรมเสรี
- บทความนี้มีชื่อเป็นภาษาอังกฤษ เนื่องจากยังไม่มีชื่อภาษาไทยที่กระชับ เหมาะสม หรือไม่รู้วิธีอ่านในภาษาไทย
16 bit Unicode Transformation Format (UTF-16) เป็นการเข้ารหัสตัวอักษรสำหรับยูนิโคดในคอมพิวเตอร์ ซึ่งสามารถเข้ารหัสตัวอักษรในยูนิโคดได้ทั้งหมด โดยปกติแล้วแล้วหนึ่งตัวอักษรมีขนาด 16 บิตหรือ 2 ไบต์ ขึ้นอยู่กับวิธีการเข้ารหัสของเครื่อง
เนื้อหา |
ตัวอย่าง [แก้]
| รหัส | ตัวอักษร | ค่ารหัส UTF-16 | แบบแสดง* |
|---|---|---|---|
| 122 (hex 7A) | Z ตัวเล็ก (อักษรลาติน) | 007A | z |
| 27700 (hex 6C34) | น้ำ (ภาษาจีน) | 6C34 | 水 |
| 119070 (hex 1D11E) | musical G clef | D834 DD1E | 𝄞 |
| "水z𝄞" (น้ำ, z, G clef), ในการเข้ารหัสแบบ UTF-16 | ||
|---|---|---|
| แบบการเข้ารหัส | การเรียงลำดับไบต์ (byte order) | ลำดับไบต์ (byte sequence) |
| UTF-16LE | little-endian | 34 6C, 7A 00, 34 D8 1E DD |
| UTF-16BE | big-endian | 6C 34, 00 7A, D8 34 DD 1E |
| UTF-16 | little-endian, with BOM | FF FE, 34 6C, 7A 00, 34 D8 1E DD |
| UTF-16 | big-endian, with BOM | FE FF, 6C 34, 00 7A, D8 34 DD 1E |
แบบแสดงที่ท่านเห็นอาจไม่ถูกต้อง ขึ้นอยู่กับฟอนต์และซอฟต์แวร์ที่ท่านใช้
อ้างอิง [แก้]
ดูเพิ่ม [แก้]
แหล่งข้อมูลอื่น [แก้]
- บันทึกทางเทคนิค Unicode #12: UTF-16 for Processing (อังกฤษ)
- ติวในสิบนาที แนะนำ UTF-16 (อังกฤษ)
- ดัชนีรายชื่อตัวอักษร Unicode (อังกฤษ)