曝光臺 注意防騙
網曝天貓店富美金盛家居專營店坑蒙拐騙欺詐消費者
136 Hts 168 ¨ 200 È 232 È
137 Htj 169 © 201 É 233 É
138 Vts 170 a 202 Ê 234 Ê
139 Pld 171 ? 203 Ë 235 Ë
140 Plu 172 ? 204 Ì 236 Ì
141 Ri 173 任意字符 205 Í 237 Í
142 ss2 174 ® 206 Î 238 Î
143 ss3 175 ˉ 207 Ï 239 Ï
144 Dcs 176 ° 208 W 240 e
145 pu1 177 ± 209 Ñ 241 Ñ
146 pu2 178 2 210 Ò 242 Ò
147 Sts 179 3 211 Ó 243 Ó
148 Cch 180 ′ 212 Ô 244 Ô
149 Mw 181 μ 213 Õ 245 Õ
150 Spa 182 ? 214 Ö 246 Ö
151 Epa 183 · 215 ´ 247 ÷
152 Sos 184 ? 216 Ø 248 Ø
153 未定義 185 1 217 Ù 249 Ù
154 Sci 186 o 218 Ú 250 Ú
155 Csi 187 ? 219 Û 251 Û
156 St 188 1/4 220 Ü 252 Ü
157 Osc 189 1/2 221 Ý 253 Ý
編碼 字符 編碼 字符 編碼 字符 編碼 字符
158 Pm 190 3/4 222 254
159 Apc 191 ? 223 ß 255 ?
XML 實用大全
第 168 頁
Latin-1 仍然缺少許多有用的字符,如希臘語、古斯拉夫語、漢語和其他文字及語言需要的字符。你也許會想到從256 開始
定義這些字符,這樣做存在一個問題,單個字節只能表示0~255 的數值,如果超出這個范圍,需要使用多字節字符集。出于
歷史的原因,許多程序都是在一個字節表示一個字符的假定下編寫的,這些程序在遇到多字節字符集時就會出錯。因此,目
前大多數操作系統(Windows NT 例外)使用不同的單字節字符集而不是一個龐大的多字節字符集。Latin-1 是最常見的這種
字符集,其他字符集用于處理別的語言。
ISO 8859 另外定義了10 個適用于不同文字的字符集(8859-2 到8859-10 和8859-15),還有4 個字符集(8859-11 到8859-14)
正在開發。表7-3 列出了ISO 字符集以及使用它的語言和文字。這些字符集共享0~127 的ASCII 碼,只是每個字符集都包含
了128~255 的其他字符。
表7-3 ISO 字符集
字符集 又 名 語 言
ISO 8859-1 Latin-1
ASCII 碼加大部分西歐語言要求的字符,包括阿爾巴尼亞語、南非荷蘭語、
巴斯克語、加泰羅尼亞語、丹麥語、荷蘭語、英語、法羅群島語、芬蘭語、
佛蘭德語、加利尼西亞語、德語、冰島語、愛爾蘭語、意大利語、挪威語、
葡萄牙語、蘇格蘭語、西班牙語、瑞典語。但是其中忽略了ij(荷蘭語)、?
(法語)和德語的引號
ISO 8859-2 Latin-2
ASCII 碼加中歐語言要求的字符,包括捷克語、英語、德語、匈牙利語、波
蘭語、羅馬尼亞語、克羅地亞語、斯洛伐克語、斯洛文尼亞語和Sorbian
ISO 8859-3 Latin-3 ASCII 碼、英語、世界語、德語、馬耳他語和加利尼西亞語要求的字符
ISO 8859-4 Latin-4
ASCII 碼加波羅地海語、拉托維亞語、立陶宛語、德語、格陵蘭島語和拉普
蘭語中要求的并且被ISO 8859-10、Latin-6 取代的字符
Latvian,Lithuania
ISO 8859-5
ASCII 碼加古斯拉夫字符,用于Byelorussian 、保加利亞語、馬其頓語、
俄語、塞爾維亞語和烏克蘭語
ISO 8859-6 ASCII 碼加阿拉伯語
ISO 8859-7 ASCII 碼加希臘語
ISO 8859-8 ASCII 碼加希伯來語
ISO 8859-9 Latin-5 就是Latin-1,但用土耳其字母代替了不常用的冰島語字母
ISO 8859-10 Latin-6 ASCII 碼和日耳曼語、立陶宛語、愛斯基摩語、拉普蘭語和冰島語中的字符
ISO 8859-11 ASCII 碼加泰國語
ISO 8859-12 適用于ASCII 碼和梵文
ISO 8859-13 Latin-7 ASCII 碼加波羅地海周邊的語言,特別是拉托維亞語
ISO 8859-14 Latin-8 ASCII 碼加蓋爾語和威爾士語
ISO 8859-15
Latin-9
Latin-0
本質上與Latin-1 相同,但是帶有歐元符號,而不用國際貨幣符。而且用芬
蘭字符代替了一些不常用的字符。用法語字母CE、ce 代替了1/4、1/2
這些字符集常有重疊。有幾種語言,特別是英語和德語可以使用多種字符集書寫。在一定程度上不同的字符集允許結合不同
的語言。例如,Latin-1 結合了大部分歐洲語言和冰島語言,而Latin-5 結合了大部分西方語言和土耳其語而不是冰島語。
XML 實用大全
第 169 頁
因此如果需要一個包括英語、法語和冰島語的文檔,應當使用Latin-1。相反,一個文檔含有英語、法語和土耳其語,則需
要Latin-5。但是,對于一個要求英語、希伯來語和土耳其語的文檔,必須使用Unicode 來書寫,因為沒有一個單字節字符
集能夠完全處理這三種語言和文字。
單字節字符集不能滿足漢語、日語和韓語的要求。這些語言含有的字符多于256 個,因此必須使用多字節字符集。
7.3.3 MacRoman 字符集
Macos 比Latin-1 早幾年出現,ISO 8859-1 標準在1987 年第一次被采用(第一個Mac 計算機是在1984 年出現)。這意味著
蘋果公司不得不定義自己的擴展字符集��MacRoman。其中大部分擴展符同Latin-1 一樣(除冰島語中的""),只是字
符對應的編碼不同。MacRoman 中前127 個字符與ASCII 碼和Latin-1 中的一樣。因此使用擴展字符的文本文件從PC 機移到
Mac 時會顯示混亂,反之亦然。表7-4 列出了MacRoman 字符集的后半部分。
表7-4 MacRoman 字符集
編碼 字符 編碼 字符 編碼 字符 編碼 字符
128 Â 160 ? 192 ? 224 ?
129 Å 161 ° 193 ? 225 ·
130 Ç 162 ¢ 194 ? 226 ?
131 É 163 £ 195 √ 227 ?
132 Ñ 164 § 196 ? 228 ‰
133 Ö 165 · 197 ? 229 Â
134 Û 166 ? 198 ? 230 Ê
中國航空網 www.k6050.com
航空翻譯 www.aviation.cn
本文鏈接地址:
XML實用大全(53)