泰國工業標準620-2533

泰國工業標準620-2533通常稱為TIS-620 ,是泰語的最常見字符集字符。該標準由泰國工業標準研究所(TISI)發布,該研究所是皇家泰國政府的工廠機構,是泰國編碼泰國的唯一官方標準。

標準的描述名稱是“計算機的泰語字符代碼”(泰語:thai:รหัสรหัสอักขระที่ใช้กับคอมพิวเตอร์คอมพิวเตอร์)。 “ 2533”是指佛教時代的2533年(1990年),《標準的當前版本》是出版的。先前的修訂版TIS 620-2529(1986)現在已經過時了。兩個版本之間的代碼頁面佈局相同。

TIS-620是TIS-620的IANA首選Charset名稱,並且該Charset名稱也用於ISO/IEC 8859-11 (它在0xA0上添加了一個不突破的空間字符,該字符在TIS-620中未分配) 。使用IANA名稱時, ISO/IEC 6429中的C0和C1控制代碼補充了代碼。

結構

TIS-620是一種傳統結構化的擴展ASCII民族特徵,它保留了與7位ASCII的完全兼容性,並使用8位範圍HEX A1將FB用於編碼泰語字母。由於泰國元音和變音符號的複雜結合性質,TIS-620僅用於信息互換,並且需要額外的顯示引擎才能正確組成字符。

變體

TIS-620幾乎相同的版本已在2001年被採用為ISO/IEC 8859-11 ,唯一的區別是ISO/IEC 8859-11將HEX A0定義為非破壞空間預訂的。 (實際上,這種小區別通常被忽略。)

ISO/IEC 8859-11集也已由ECMA International註冊為ISO-IR-166 ,但是這種變化添加了明確的逃生代碼,以發出泰語字符序列的開始和結尾。

TIS-620字符集排序基本上已經使用了UnicodeISO/IEC 10646 )中的使用。 Unicode的泰式塊是U+0E01通過U+0E7F,只需通過將每個字節與0E和從值中減去六個字節,可以將TIS-620泰語字符轉換為UTF-16

字符集

TIS-620
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1倍
2倍  sp  ! " # $ % & ' ( ) * + , - . /
3倍 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5倍 P Q R S T U V W X Y z [ \ ] ^ _
6倍 ` a b c d e f G h j k l m n o
7x p q r s t v w x y z { | } ~
8x
9x
斧頭
Bx
CX
DX ั ำ ิ ี ึ ื ุ ู ฺ ฿
前任 ็ ่ ้ ๊ ๋ ์ ํ ๎
fx

在上表中,20是常規空間特徵。代碼值00-1F,7F,80-9F,A0,DB-DE和FC-FF未通過TIS-620分配給字符。

代碼值D1,D4-DA,E7-EE正在組合字符

進一步閱讀

  • Flohr,Guido(2016)[2006]。 “ locale :: recodedata :: tis_620- tis -620的轉換例程”cpan libintl-perl 。 1.0。從2017-01-15的原件存檔。檢索2017-01-14