曝光臺 注意防騙
網曝天貓店富美金盛家居專營店坑蒙拐騙欺詐消費者
135 Á 167 ß 199 ? 231 Á
136 À 168 ® 200 ? 232
137 Â 169 © 201 ... 233 È
138 Ä 170 ™ 202 非換行空格 234 Í
139 Ã 171 ′ 203 À 235 Î
140 Å 172 ¨ 204 Ã 236 Ï
141 Ç 173 ≠ 205 Õ 237 Ì
142 É 174 Æ 206 ? 238 Î
143 È 175 Ø 207 ? 239 Ó
144 Ê 176 ∞ 208 ˉ 240 Ô
145 Ë 177 ± 209 _ 241 Apple
146 Í 178 ≤ 210 " 242 Ò
147 Ì 179 ≥ 211 " 243 Ú
148 Ì 180 ¥ 212 ‘ 244 Û
149 Ï 181 μ 213 ‘ 245 1
續表
編碼 字符 編碼 字符 編碼 字符 編碼 字符
150 ñ 182 ¶ 214 ÷ 246 ?
151 ó 183 Σ 215 à 247 ~
152 ò 184 Π 216 ? 248 ˉ
XML 實用大全
第 170 頁
153 ô 185 Π 217 ? 249
154 ö 186 ∫ 218 / 250 .
155 õ 187 a 219 ¤ 251 °
156 ú 188 ° 220 ? 252 ?
157 Ù 189 Ω 221 ? 253 ".
158 Û 190 Æ 222 fi 254 .
159 Ü 191 Ø 223 fl 255 ?|
7.3.4 Windows ANSI 字符集
第一個被廣泛使用的Windows 版本比Mac 晚幾年出現,因此它能夠采用Latin-1 字符集。它使用更多的可打印字符代替介于
130 和159 之間的非打印控制字符,從而進一步擴展了使用范圍。這個經過修改的Latin-1 版本通常被稱作Windows ANSI。
表7-5 列出了Windows ANSI 字符集。
表7-5 Windows ANSI 字符集
編碼 字符 編碼 字符 編碼 字符 編碼 字符
128 未定義 136 ? 144 未定義 152 ~
129 未定義 137 ‰ 145 ‘ 153 ™
130 , 138 146 ‘ 154 154 §
131 □ 139 ? 147 " 155 ?
132 " 140 ? 148 " 156 ?
133 ... 141 未定義 149 � 157 未定義
134 ? 142 未定義 150 – 158 未定義
135 ? 143 未定義 151 — 159 ?
XML 實用大全
第 171 頁
7.4 Unicode 字符集
為了使不同的字符集能夠處理好不同的文字和語言,必須滿足:
1. 不同時引用多種文字。
2. 不與使用不同字符集的人交換文件。
由于Mac 和PC 機都使用不同的字符集,越來越多的人無法遵循以上原則。很明顯的是需要一種得到大家的認可并且編碼了
全世界各種文字的字符集。建立這樣的字符集很難,需要對成百上千種語言和文字有細致的了解。要使軟件開發商們同意使
用這種字符集就更難了。不過這方面的努力一直在進行,終于創建了一個符合要求的字符集��Unicode。而且主要賣
方(微軟、蘋果、IBM、Sun、Be 等)正逐步趨向于使用它。XML 把Unicode 當作自己的默認字符集。
Unicode 使用0~65,535 的雙字節無符號數對每一個字符進行編碼。目前已經定義了40,000 多個不同的Unicode 字符,剩余
25,000 個空缺留給將來擴展之用。其中大約20,000 個字符用于漢字,另外11,000 左右的字符用于韓語音節。Unicode 中
0~`255 的字符與Latin-1 中的一致。
如果在本書中顯示所有的Unicode 字符,那么除了這些字符表格外,書中將容納不下別的任何東西。如果需要知道Unicode
中不同字符的確定編碼,買一冊Unicode 標準(第二版,ISBN 0-201-48346-9,Addison-Wesley 出版)。該書共950 頁,
包括對Unicode 2.0 的全部詳細說明,還包括Unicode 2.0 中定義的所有字符集的圖表。還可以在Unicode 協會的網址:
http://www.unicode.org/和http://charts.unicode.org/中發現在線信息。表7-6 列出了由Unicode 編碼的文字,由此可
知Unicode 的廣泛性。每一種文字的字符通常編碼在65,536 個號碼中的一個連續區域內。許多語言都能使用其中某一區域
的字符書寫(例如,使用古斯拉夫語書寫俄語),盡管有一些語言,如克羅地亞語或土耳其語需要混合匹配前4 個拉丁文區
域中的字符。
表7-6 Unicode 文字塊
文 字 范 圍 目 的
Basic Latin
基本拉丁語
0-127 ASCII 碼,美式英語
Latin-1 Supplement
拉丁語補充-1
126-255
ISO Latin-1 前半部分結合Basic Latin 能處理丹麥語、荷蘭語、英語、法羅
群島語、佛蘭德語、德語、夏威夷語、冰島語、印度尼西亞語、愛爾蘭語、挪
威語、葡萄牙語、西班牙語、斯瓦西里語和瑞典語
Latin Extended-A
拉丁文擴展集-A
256-383
該字符塊增添了ISO 8859 字符集Latin-2、Latin-3、Latin-4 中的字符,而
且是Basic Latin 和Latin-1 沒有的字符。同它們結合能夠編碼南非荷蘭語、
法國布里多尼語、巴斯克語、加泰羅尼亞語、捷克語、世界語、愛沙尼亞語、
法語、Friesland 語、格陵蘭島語、匈牙利語、拉脫維亞語、立陶宛語、馬耳
它語、波蘭語、普羅旺斯語、羅馬尼亞語、吉普塞語、斯洛伐克語、斯洛文尼
亞語、土耳其語和威爾士語
Latin Extended-B
拉丁文擴展集-B
383-591
大部分字符用于擴展Latin 文字以處理使用非傳統文字寫的語言,包括許多非
洲語言、克羅地亞連字符,與塞爾維亞古斯拉夫字母、中國的拼音和Latin-10
中的Sami characters 相匹配
IPA 擴展字符集 592-687 國際音標字母
間距調節字符 686-767 通常能夠改變前面字母發音的小符號
可識別的連接字符 766-879 不獨立存在,一般與前面的字母連用(放置在上邊)的可識別的記號,如:~、
XML 實用大全
第 172 頁
‘and ??
希臘 880-1023 基于ISO 8859-7 的現代希臘語,同時提供古埃及語字符
中國航空網 www.k6050.com
航空翻譯 www.aviation.cn
本文鏈接地址:
XML實用大全(54)